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(57) Abstract: The invention relates to a method for 
analysing nucleic acid chains. The basis for the method 
is the detection of the fluorescent signals of individual 
nucleotide molecules, labelled with dyes, which are in- 
corporated into growing nucleic acid chains by a poly- 
merase. The reaction takes place on a planar surface. 
A large number of individual nucleic acid molecules 
are immobilised on said surface. All these nucleic acid 
molecules are subjected to the same conditions, so that 
a synthesis reaction can take place simultaneously in all 
the nucleic acid molecules. 
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(57) Zusammenfassung: Die Erfindung betrifTt 
cin Verfahren zur Analyse von Nukleinsaureketten. 
GrundJage der Methode ist die Detektion von 
Fluoreszenzsignalen einzelner, mit FarbstofTen 
markicrter Nukleotidmolekiile, die durch eine Poly- 
merase in wachsende Nukleinsaureketten eingebaut 
werden. Die Reaktion verlauft auf einer planen 
Oberflache. Auf dieser Oberflache sind viele einzelne 
Nukleinsaure-Molekiile immobilisiert. Alle diese 
Nukleinsaure-Molekule sind gleichen Bedingungen 
ausgesetzt, so dass an alien Nukleinsaure-Molekulen 
gleichzeitig eine Aufbaureaktion ablaufen kann. 
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Ver^jihrei* zur Analyse von ^lelw^reKsfctoa 



Die Erfindung betrifft ein Verfahren zur Analyse von 
Nukleinsaureketten. Die Grundlage der Methode ist die Detektion 
von Fluoreszenzsignalen einzelner mit Farbstoffen markierter 
Nukleotidmolekule, die durch eine Polymerase in eine wachsende 
Nukleinsaurekette eingebaut werden. Die Reaktion verlcLuft auf 
einer planen Oberflache. An diese Oberflache sind viele 
einzelne Nukleinsaure-Molekule gebunden. Alle diese 
Nukleinsaure-Molekule sind gleichen Bedingungen ausgesetzt, so 
dass an alien Nukleins^ure-Molekulen gleichzeitig eine 
Aufbaureaktion ablaufen kann. 
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Das Verfahren umfaSt im wesentlichen folgende Schritte: 

1) Bindung der Nukleinsaureketten (NSKFs) auf einer planen 
Oberflache mit anschlieSender Hybridisierung von Primern, 

5 alternativ Bindung von Primern mit anschlieSender 
Hybridisierung von NSKFs, so dass NSKF-Primer-Komplexe 
gebildet werden. 

2) Durchffihren einer zyklischen Aufbaureaktion, wobei jeder 
Zyklus aus folgenden Schritten besteht: 

10 a) Zugabe einer L6sung mit markierten Nukleotiden (NTs*) 
und Polymerase zu den gebundenen NSKF-Primer- 
Komplexen, 

b) Inkubation der gebundenen NSKF-Primer-Komplexe mit 
dieser Losung unter Bedingungen, die zur Verletngerung 

15 der komplementaren Strange urn ein NT geeignet sind, 

c) Was chen, 

d) Detektion der Signale von einzelnen Molekulen, 

e) Entfernung der Markierung von den eingebauten 
Nukleotiden, 

20 f) Waschen. 

Gegebenenfalls erfolgen mehrfache Wiederholungen des 
Zyklus . 

3) Analyse der detektierten Signale der einzelnen Molekule. 

4) Rekonstruktion der Sequenzen aus den Einzeldaten. 

25 

1^ AbKuyzwgen mad ^gr;Uf Periauterwigen 

DNA - Desoxyribonukleinsaure verschiedenen Ursprungs und unter- 
30 schiedlicher L&nge (genomische DNA, cDNA, ssDNA, dsDNA) 

RNA - Ribonukleinsaure (meist mRNA) 

Polymerasen - Enzyme, die komplementare Nukleotide in einen 
35 wachsenden DNA- oder RNA- Strang einbauen kdnnen ( z.B. DNA- 
Polymerasen, Reverse-Transkriptasen, RNA- Polymerasen) 



dNTP - 2 ! -deoxi-Nucleosid-Triphosphate, Substrate fur DNA- 
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Polymerasen und Reverse -Transkriptasen 

NTP - Nukleosid- Triphosphate, Substrate fur RNA- Polymerasen 

5 NT - nattLrliches Nukleotid, meist dNTP, wenn nicht ausdrticklich 
anders gekennzeichnet. 

Abkurzung "NT" wird auch bei der Langenangabe einer Nukleinsau- 
resequenz verwendet, z.B. 1.000 NT. In diesem Fall steht "NT" 
10 fur Nukleosid-Monophosphate. 

Im Text wird bei Abkurzungen die Mehrzahl durch Verwendung des 
Suffixes "s" gebildet, "NT" steht zum Beispiel fur 

"Nukleotid" , "NTs " steht fOr mehrere Nukleotide. 

15 

NT* - modif iziertes Nukleotid, meist dNTP, wenn nicht ausdrxlck- 
lich anders gekennzeichnet. NTs* bedeutet: modif izierte Nukleo- 
tide 

20 NSK - NukleinsSurekette . DNA Oder RNA in ihrer ursprunglichen 
Lange 

NSKF - Nukleinsaurekettenf ragment (DNA Oder RNA) , das einem 
Teil der Gesamtsequenz entspricht, NSKFs 

25 Nukleinsaurekettenf ragmente . Die Summe der NSKFs bildet ein 
Aquivalent zur Gesamtsequenz. Die NSKFs konnen beispielsweise 
Fragmente von DNA- oder RNA- Gesamtsequenz sein, die nach einem 
Fragmentierungsschritt entstehen. 

30 Gesamtsequenz - die in der Sequenzierungsreaktion eingesetzte 
Sequenz oder die eingesetzten Sequenzen, meistens in NSKFs 
uberfuhrt. Sie kann ursprunglich aus einer oder mehreren NSKs 
bestehen. Dabei kann die Gesamtsequenz Teile oder Aquivalente 
einer anderen Sequenz oder von Sequenz -Populationen darstellen 

35 (z.B. mRNA, cDNA, Plasmid-DNA mit Insert, BAC, YAC) und aus 
einer oder unterschiedlichen Spezies stammen. 



Primerbindungs telle (PBS) - Teil der Sequenz in der NSK oder 
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NSKF/ an den der Primer bindet. 

Referenzsequenz - eine bereits bekannte Sequenz, zu der die 
Abweichungen in der zu untersuchenden Sequenz bzw. in den zu 
5 untersuchenden Sequenzen (Gesamt sequenz) ermittelt werden. Als 
Referenzsequenzen kSnnen in Datenbanken zugangliche Sequenzen 
verwendet werden, wie z.B. aus der NCBI-Datenbank. 

Tm - Schmelztemperatur 

10 

Plane Oberfl&che: Oberflache, die vorzugsweise folgende 
Merkmale aufweist: 1) Sie erlaubt, mehrere einzelne Molekule, 
vorzugsweise mehr als 100 , noch besser mehr als 1000, mit dem 
jeweiligen gegebenen Objektiv-Oberf lache-Abstand bei einer 
15 Objektivposition gleichzeitig zu detektieren. 2) Die 
immobilisierten einzelnen Molekule befinden sich in derselben 
Fokusebene, die reproduzierbar eingestellt werden kann. 

Weitfeld-Optik-Detektionssystem - Detektionssystem, das 
20 gleichzeitig Fluoreszenzsignale von einzelnen, auf einer 
Flache verteilten Molekulen detektieren kann, wobei die Fl&che 
ca. 100 fim 2 und grofier ist. Ein Beispiel fur Weitfeld- 
Detektionsoptik stellt Fluoreszenzmikroskop Axiovert 200 Oder 
Axioplan 2e (Zeiss) mit einem Planneof luar-Objektiv lOOx NA 
25 1.4 Olimmersion (Zeiss), oder einem Planapochromat-Objektiv 
lOOx NA 1.4 Olimmersion (Zeiss); die Anregung der Fluoreszenz 
kann dabei mit einer Lampe, z.B. Quecksilberdampf lampe, oder 
einem Laser oder Dioden erfolgen. Sowohl Epif luoreszenzmdus 
als auch im Totalref lexions-Fluoreszenzmikroskopie-Modus 
30 (total internal reflection fluorescence microscopy, TIRF- 
Microscopy) oder Laser-Scanning-Mikroskopie-Modus konnen 
verwendet werden. In dieser Anmeldung wird Gebrauch von dieser 
Weitfeld-Detektionsoptik gemacht 

35 

Sterisches Hindernis: Sterisch anspruchsvolle Gruppe, die durch 
ihre chemische Struktur die Eigenschaf ten der mit dieser Gruppe 
gekoppelten NTs* so verandert, dass diese durch eine Polymerase 



f 
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in einer Extensionsreaktion nicht nacheinander eingebaut werden 
konnen. 

Definition der Termination: Als Termination wird in dieser An- 
5 meldung der reversible Stop des Einbaus der modif izierten unge- 
spalteten NTs* bezeichnet. 

Dieser Begriff ist von dem ublichen Gebrauch des Wortes "Termi- 
nation" durch Dideoxy-NTP bei einer konventionellen 
Sequenzierung zu trennen. 

10 

Die Termination kommt nach dem Einbau eines modif izierten NT* 
zustande. Das modif izierte eingebaute NT* tragt eine an die Base 
reversibel gekoppelte sterische Gruppe, die zur Behinderung des 
Einbaus eines n&chsten komplement&ren NT* in den wachsenden 
15 Strang durch eine Polymerase ftihrt. 

Genprodukte - Bei den Genprodukten handelt es sich um die 
primaren Genprodukte der Gene. Im wesentlichen handelt es sich 
dabei um RNA-Transkripte der genannten Gene, welche auch als 
20 Target -Sequenzen (oder Target -NukleinsSuresequenzen) bezeichnet 
werden. Diese Target -Sequenzen schlieSen neben mRNA auch davon 
abgeleitete einzelstrangige und doppelstrangige cDNA, von cDNA 
abgeleitete RNA oder von cDNA amplif izierte DNA ein. 

25 Einzelnukleotidpolymorphismen (single nucleotide 

polymorphisms, SNPs) - Veranderungen in den Sequenzen, die als 
Substitution (Transition oder Transversion) oder als Deletion 
oder Insertion einzelner NT auftreten kdnnen. 

30 

2^ Stand der Technik 

Die Nukleinsaurenketten-Sequenzsuialyse ist in vielen Bereichen 
der Wissenschaf t, Medizin und Industrie zu einem wichtigen 
35 Werkzeug geworden. Zur Analyse wurden mehrere Verfahren 
entwickelt . 



Die bekanntesten Verfahren sind die Ketten-Terminations-Sequen- 
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zierung nach Sanger (P. Sanger et al. PNAS 1977 v. 74 s. 5463), 
die auf detn Einbau von Kettenterminatoren basiert, und die 
Maxam-Gilbert-Methode, die auf Basen-spezif ischer Modifikation 
und Spaltung von Nukleinsaureketten beruht (A.M. Maxam and W. 
5 Gilbert PNAS 1977, v. 74 S.560) . Beide Methoden liefern eine 
Anzahl von Nukleinsaurekettenf ragmenten verschiedener Langen. 
Diese Fragmente werden der Lange nach in einem Gel aufgetrennt. 
Dabei mussen alle Nachteile der Elektrophorese (wie z.B. lange 
Laufzeit, relativ kurze Strecken von Sequenzen, die in einem 
10 Ansatz bestimmt werden konnen, begrenzte Anzahl der parallelen 
Ansatze sowie relativ groSe Mengen an DNA) in Kauf genommen 
werden. Diese Methoden sind sehr arbeitsintensiv und langsam. 

Ein weiteres Verfahren zur Sequenzierung basiert auf der Hybri- 
15 disierung von Nukleinsaureketten mit kurzen Oligonukleotiden. 
Dabei wird mit mathematischen Methoden berechnet, wie viele 
Oligonukleotide einer bestimmten L&nge vorhanden sein mussen, 
urn eine komplette Sequenz zu ermitteln (Z.T. Strezoska et al. 
PNAS 1991 v.88 S. 10089, R.S.Drmanac et al. Science 1993 v. 260 
20 S.1649) . Auch dieses Verfahren ist mit Problemen behaftet: Es 
kann nur eine Sequenz in einem Ansatz bestimmt werden, sekun- 
dare Strukturen storen die Hybridisierung und Sequenzwiederho- 
lungen verhindern die korrekte Analyse. 

25 Eine andere Mdglichkeit zur Sequenzierung haben Arbeitsgruppen 
beispielsweise von (Dower US Patent 5.547.839, Canard et al. US 
Patent 5.798.210, Rasolonjatovo Nucleosides & Nucleotides 1999, 
v.18 S.1021, Metzker et al. NAR 1994, v. 22, S.4259, Welch et 
al. Nucleosides & Nucleotides 1999, v. 18, S.197) entwickelt. 

30 Diese Methode wird abgekurzt als BASS (Base Addition Sequencing 
Scheme) oder SBS (Sequecing by Synthesis) bezeichnet. Dabei 
wird eine groSe Anzahl gleicher einzelstrSngiger DNA-Stiicke an 
einem definierten Ort auf einer Oberfl&che fixiert und das 
Signal von der Gesamtheit dieser vielen identischen DNA-Stucke 

35 analysiert. Zu dieser fixierten DNA wird eine L6sung mit 
Polymerase und Nukleotiden zugegeben, so dass ein 
komplementarer Strang synthetisiert werden kann. Dabei soil die 
Polymerase schrittweise arbeiten: in jedem Schritt wird nur ein 
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einziges Nukleotid eingebaut. Dieses wird detektiert, worauf 
die Polymerase in einem nSchsten Zyklus das n&chste Nukleotid 
einbaut - Bei dieser Methode wurden an der 3 1 -OH-Gruppe der 
Deoxyribose modif izierte Nukeotide verwendet. 
5 Trotz des Gelingens einiger einzelner Schritte der Methode 
wurde sie nicht zu einem funktionsfahigen Verfahren 
entwickelt. Dies kann beispielsweise auf folgenden Tatsachen 
beruhen: Beim Aufbau der komplementaren Strange tritt sehr 
schnell eine Desynchronisation der Synthese auf, so dass bei 

10 jedem Schritt die Fehler akkumulieren. Deshalb kdnnen nur sehr 
kurze Fragmente sequenziert werden. Es ist zu betonen, dass 
alle beschriebenen BASS-Methoden nicht auf der Detektion von 
einzelnen Molekiilen beruhen. Das Signal wird stattdessen von 
einer groSen Anzahl identischer an einem definierten Ort 

15 immobilisierter Molekule registriert. Die in diesen Methoden 
ubliche Verwendung der Begriffe "einzelne Molekule" und 
"Molekule" zielt dabei nicht auf individuelle, voneinander ge- 
trennte Molekule, sondern auf eine Population, die aus vielen 
identischen Molekulen besteht. Identisch heiSt in diesem Fall, 

20 dass die Molekule die gleiche Sequenz haben. 

Ein weiteres Problem stellen die an 3 "-Position modif izierten 
Nukleotide dar. Einerseits fuhrt die Ankopplung groSer 
Substituenten an diese Position der Nukleotide in vielen Fallen 
zur Stoning der Einbaureaktion durch die Polymerasen , 

25 Andererseits sind Polymerasen im Stande, einige Modif ikationen 
von der 3 "-Position abzuspalten. 

Die Aufgabe der vorliegenden Erfindung besteht daher darin, ein 
Verfahren z\ir Sequenzanalyse von Nxikleinsaureketten 

30 bereitzustellen, das die Nachteile der oben erwahnten Methoden 
nicht aufweist und vor allem eine billigere, schnellere und 
effizientere Analyse von Nukleinsauresequenzen erm6glicht. 
Insbesondere soli das Verfahren in der Lage sein, viele 
Sequenzen parallel zu bestimmen. Es kann dann beispielsweise 

35 fur die Analyse sehr langer Nxikleinsaureketten (mehrere Mb) 
oder fur die Variantenalyse an vielen kurzen Ketten 
(Mutationsanalyse, SNP-Analyse) in einem Ansatz verwendet 
werden. 
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3^ Kurze Beschreibung 

5 Die Aufgabe wird erf indungsgemaS durch ein Verfahren zur 
parallelen Sequenzanalyse von Nukleinsauresequenzen (Nu- 
kleinsaureketten, NSKs) gelost, bei dem man 

Fragroente (NSKFs) einzelstrangiger NSKs mit einer L&nge von 
10 etwa 50 bis 1000 Nukleotiden erzeugt, die uberlappende 
Teilsequenzen der Gesamtsequenzen darstellen, man 

die NSKFs unter Verwendung eines einheitlichen oder 
mehrerer unterschiedlicher Primer in Form von NSKF-Primer- 
15 Komplexen auf einer Reaktionsoberf lache in einer zuf&lligen 
Anordnung bindet, man 

eine zyklische Aufbaureaktion des komplementaren Stranges 
der NSKFs unter Verwendung einer oder mehrerer Polymerasen 
20 durchfuhrt, indem man 

a) zu den an die Oberflache gebundenen NSKF-Primer- 
Komplexen eine Losung zugibt, die eine oder mehrere 
Polymerasen und ein bis vier modifizierte Nukleotide 
25 (NTs*) enthait, die mit Fluoreszenzfarbstof fen markiert 

sind, wobei die bei gleichzeitiger Verwendung von 
mindestens zwei NTs* jeweils an den NTs* befindlichen 
Fluoreszenzfarbstof fe so gewahlt sind, dass sich die 
verwendeten NTs* durch Messung xanterschiedlicher Fluo- 
reszenzsignale voneinander unterscheiden lassen, wobei 
die NTs* strukturell an der Base so modifiziert sind, 
dass die Polymerase nach Einbau eines solchen NT* in 
einen wachsenden komplementaren Strang nicht in der 
Lage ist, ein wei teres NT* in denselben Strang ein- 
zubauen, wobei der Fluoreszenzfarbstof f abspaltbar ist 
und die strukturelle Modifikation ein abspaltbarer 
sterisch anspruchsvoller Ligsuid ist, man 
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b) die in Stufe a) erhaltene stationare Phase unter 
Bedingungen inkubiert, die zur Verlangerung der kom- 
plementaren Strange geeignet sind, wobei die 

5 komplementaren Strange jeweils urn ein NT* verl&ngert 

werden, man 

c) die in Stufe b) erhaltene stationfire Phase unter 
Bedingungen wSscht, die zur Entfernung nicht in einen 

10 komplementaren Strang eingebauter NTs* geeignet sind, 

man 

d) die einzelnen, in komplementare Strange eingebauten 
NTs* durch Messen des fur den jeweiligen Fluo- 

15 reszenzfarbstoff charakteristischen Signals detek- 

tiert, wobei maui gleichzeitig die relative Position 
der einzelnen Fluoreszenzsignale auf der Reaktions- 
oberflache bestimmt, man 

20 e) zur Erzeugung unmarkierter (NTs oder) NSKFs die Fluo- 
reszenzfarbstof fe und die sterisch anspruchsvollen 
Liganden von den am komplementaren Strang angefugten 
NTs* abspaltet, man 

25 f) die in Stufe e) erhaltene stationare Phase unter 
Bedingungen wascht, die zur Entfernung der Fluo- 
reszenzfarbstoffe und der Liganden geeignet sind, man 



die Stufen a) bis f) gegebenenfalls mehrfach wiederholt, 



30 



wobei man die relative Position einzelner NSKF- Primer- Komplexe 
auf der Reaktionsoberf lache und die Sequenz dieser NSKFs durch 
spezifische Zuordnung der in Stufe d) in auf einanderfolgenden 
Zyklen an den jeweiligen Positionen detektierten Fluores- 
35 zenzsignale zu den NTs bestimmt. 



Aus den ermittelten Teilsequenzen kann mam beispielsweie die 
Gesamtsequenz der NSKs bestimmen. Unter einer parallelen 
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Sequenzanalyse wird in diesem Zusammenhang die gleichzeitige 
Sequenzanalyse vieler NSKFs verstanden (beispielsweise 
1.000.000 bis 10.000.000), wobei diese NSKFs von einer 
einheit lichen NSK- Population oder von mehreren 
5 unterschiedlichen NSK-Populationen abgeleitet sind. 

Die erhaltene Population von uberlappenden Teilsequenzen lSSt 
sich beispielsweise bei de novo Sequenzierung mit kommerziell 
erhaltlichen Programmen zur Gesamtsequenz der NSK zusammenfxlgen 
10 (Huang et al. Genom Res. 1999 v. 9 S.868, Huang Genomics 1996 
v.33 S.21, Bonfield et al. NAR 1995 v. 23 S.4992, Miller et al. 
J.Comput .Biol. 1994 v.l S.257) . 

Bei der Analyse von Varianten einer bekannten Referenzsequenz 
15 las sen sich Mutationen oder Einzelnukleotidpolymorphismen durch 
einen Vergleich der erhaltenen uberlappenden Teilsequenzen mit 
der Referenzsequenz feststellen. 

Gemafi einer besonderen Ausfiihrungsform der Erfindung kann das 
20 Verfahren durchgefuhrt werden, indem man die Stufen a) bis f) 
der zyklischen Aufbaureaktion mehrfach wiederholt, wobei man 

a) in jedem Zyklus nur jeweils ein markiertes NT*, 

b) in jedem Zyklus jeweils zwei unterschiedlich markierte 
25 NTs* oder 

c) in jedem Zyklus jeweils vier unterschiedlich markierte 
NTs* 



einsetzt . 

30 

Wenn die NSKs Varianten einer bekannten Referenzsequenz sind 
kann das Verfahren auch durchgefflhrt werden, indem man die 
Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach 
wiederholt, wobei main in den Zyklen abwechselnd jeweils zwei 
35 unterschiedlich markierte NTs* und zwei unmarkierte NTs einsetzt 
und man die Gesamtsequenzen durch Vergleich mit der 
Referenzsequenz ermittelt . 
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Gegenstand der vorliegenden Erfindung sind f erner die in den 
Figuren 7e, 7f und 7g dargestellten Nukleotide und die ent- 
sprechenden markierten Nukleotide, die beispielsweise an die 
terminale Amino funkt ion angeheftete Pluoreszenzfarbstof fe 
5 aufweisen, oder die in den Figuren 7h, 7i oder 7j dargestellten 
markierten Nukleotide* 

Gegenstand der vorliegenden Erfindung ist f erner die Verwendung 
der in Figuren 7e,7f und 7g dargestellten Nukleotide und der 
10 entsprechenden mit einem Fluoreszenzfarbstof f markierten 
Nukleotide fur das erf indungsgemafien Verfahren. 

Gegenstand der vorliegenden Erfindung ist f erner die Verwendung 
der an der Base modif izierten NT*s (Beispiele siehe Figuren 
15 7k, 7L und 7m) und der entsprechenden mit einem 
Fluoreszenzfarbstoff markierten Nukleotide fur das 
erfindungsgem&Se Verfahren. 

Gegenstand der Erfindung ist ferner ein Kit zur Durchfuhrung 
20 des Verfahrens das eine Reaktionsoberf lache, zur Durchfuhrung 
des Verfahrens erforderliche Reaktionsl6sungen, eine oder 
mehrere Polymerasen, und Nukleotide (NTs) enthait, von denen 
ein bis vier mit Fluoreszenzfarbstof fen markiert sind, wobei 
die NTs ferner strukturell so modif iziert sind (NT* bzw. NTs*) , 
25 dass die Polymerase nach Einbau eines solchen NT* in einen 
wachsenden komplementaren Strang nicht in der Lage ist, ein 
wei teres NT* in denselben Strang einzubauen, wobei der Fluores- 
zenzfarbstoff abspaltbar ist und die strukturelle Modifikation 
ein abspaltbarer sterisch anspruchsvoller Ligand ist. Bei den 
30 Nukleotiden handelt es sich vorzugsweise urn die oben genannten 
erfindungsgemaSen Nukleotide. 

GemaS einer besonderen Ausfuhrungsform der Erfindung enthalt 
das Kit ferner zur Erzeugung von Einzelstr^ngen aus 
35 Doppelstrangen erforderliche Reagenzien, einzelstrangige 
Nukleins&uremolekule, die als PBS in die NSKFs eingefiihrt 
werden, Oligonukleotid-Primer, zur Abspaltung der Fluores- 
zenzfarbstof fe und sterisch anspruchsvollen Liganden 
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erforderliche Reagenzien und/oder Waschlosungen. 

Die erf indungsgemaSe Methode dient zur Ermittlung der 
5 Nukleinsauresequenzen und kann in verschiedenen Bereichen der 
Genet ik eingesetzt werden. Dazu zahlen insbesondere die 
Bestimmung unbekannter, langer Sequenzen, Analysen von Sequenz- 
Polymorphismen und Punktmutationen sowie die parallele Analyse 
einer grofien Zahl an Gensequenzen. 

10 

Die Vorbereitung des zu analysierenden Materials (einzel- und 
doppelstrangige Nukleinsauresequenzen) hangt von der 
Aufgabenstellung ab und hat das Ziel, aus einer langen Nuklein- 
saurekette eine Population an relativ kleinen, einzelstrangigen 
15 Nukleinsaurekettenf ragmenten (NSKFs) zu bilden, diese Fragmente 
mit einem fur den Start der Sequenzierungsreaktion geeigneten 
Primer zu versehen (NSKF-Primer-Komplexe) und auf einer planen 
Oberflache zu fixieren. 

20 Dabei werden einzelne NSKFs auf einer planen Oberflache in 
einer solchen Weise fixiert, dass eine enzymatische Reaktion an 
diesen Molekiilen ablaufen kann. Prinzipiell sind verschiedene 
Arten der Immobilisation moglich, die von der Zielsetzung, der 
Art der NSK und der fur die Reaktion eingesetzten Polymerase 

25 abhangen. Die NSKFs werden bei der Immobilisierung bzw. Bindung 
zufallig auf der Oberflache verteilt, d,h. es muB also nicht 
auf eine exakte Positionierung der einzelnen Ketten geachtet 
werden. NSKF-Primer-Komplexe konnen iiber die NSKFs oder Primer 
an die Oberflache gebunden werden. Die NSKF-Primer-Komplexe 

30 nriissen dabei in einer solchen Dichte auf der Oberflache fixiert 
werden, dass eine eindeutige Zuordnung der spater detektierten 
Signale von den eingebauten NT*s zu einzelnen NSKFs 
gewahrleistet ist. 

35 Nach der Vorbereitung der NSKFs startet man mit alien auf der 
Oberflache immobilisierten NSKF-Primer-Komplex-Molekulen die 
Sequenzierungsreaktion. Als Grundlage der Sequenzierung dient 
die Synthese des komplementSren Stranges zu jedem einzelnen 
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gebundenen NSKF. Dabei werden in den neu synthetisierten Strang 
markierte NTs* eingebaut. Die Polymerase baut nur ein einziges 
markiertes NT* in die wachsende Kette ein. Dies wird durch die 
reversible Ankopplung einer zur Termination fiihrenden, sterisch 
5 anspruchsvollen Gruppe an die NTs* erreicht. Der Einbau eines 
weiteren markierten NT* wird dadurch unmoglich gemacht. Diese 
sterisch anspruchsvolle Gruppe ist vorzugsweise ein 
Fluoreszenzf arbstof f . 

10 Die Sequenzierungsreaktion verlauf t in mehreren Zyklen. Ein 
Zyklus umfasst folgende Schritte: 

a) Zugabe einer Losung mit markierten Nukleotiden (NTs*) und 
Polymerase zu den gebundenen NSKF- Primer -Komplexen, 
15 b) Inkubation der gebundenen NSKF- Primer- Komplexe mit dieser 
Ldsung unter Bedingungen, die zur Verlangerung der kom- 
plement&ren Strange urn ein NT geeignet sind, 

c) Was chen, 

d) Detektion der Signale von einzelnen Molekulen, 

20 e) Entfernung der Markierung von den eingebauten Nukleotiden, 
f) Waschen. 

Gegebenenfalls erfolgt eine mehrfache Wiederholung des Zyklus 
(a-f ) . 

25 

Die Reaktionsbedingungen des Schrittes (b) in einem Zyklus wer- 
den so gewahlt, dass die Polymerasen an mehr als 50% der an der 
Sequenzierungsreaktion beteiligten NSKFs (extensionsfahige 
NSKF-Primer-Komplexe) in einem Zyklus ein markiertes NT* 
30 einbauen konnen, vorzugsweise an mehr als 90%. 

Die Anzahl der durchzufuhrenden Zyklen hangt dabei von der je- 
weiligen Aufgabenstellung ab, ist theoretisch nicht beschrankt 
und liegt vorzugsweise zwischen 20 und 5000. 

35 

Danach wird fur jedes fixierte NSKF seine spezifische Sequenz 
aus der Reihenfolge der eingebauten NTs* ermittelt. 
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Aus den uberlappenden NSKF-Sequenzen kann in einer 
Aus fiihrungs form die ursprungliche NSK-Sequenz rekonstruiert 
werden ("Automated DNA sequencing and analysis" S. 231 ff . 1994 
M. Adams et al. Academic Press , Huang et al. Genom Res. 1999 
5 v. 9 S.868, Huang Genomics 1996 v. 33 S.21, Bonfield et al. NAR 
1995 v.23 S.4992, Miller et al. J . Comput . Biol . 1994 v.l S.257) . 
Dabei sucht man in der gesamten Population von NSKF-Sequenzen 
nach Ubereinstimmungen/Uberlappungen in den Sequenzen von 
NSKFs. Durch diese Ubereinstimmungen/Uberlappungen kann man die 
10 NSKF in eine Reihe bringen, z.B.: 

ACTGTGCGTCCX3TATGATGGTCATTCCATG 

CATTCCATGGTACGTTAGCTCCTAG 

TCCTAGTAAAATCGTACC . 

15 

In der Praxis hat sich bei einer Sequenzierung von unbekannten 
Sequenzen bewahrt, eine Lange der sequenzierten Stiicke von mehr 
als 300 bp zu erreichen. Das erlaubt die Sequenzierung von 
Genomen aus Eukaryonten im Schrotschuss-Verfahren. 

20 

Dabei konnen die Fehler der Methode mit verschiedenen Mitteln 
erfasst und korrigiert werden. Samtliche Schritte des 
Verfahrens konnen weitgehend automatisiert werden. 

25 Durch die Arbeit mit einzelnen Molekulen ergeben sich mehrere 
Vorteile gegenuber der friiher beschriebenen BASS-Methode: 

1. Da die Molekule einzeln detektiert werden, besteht keine 
Gefahr, dass das Signal durch die Desynchronisation in der 

30 Population fehlerhaft wird. Fur jedes fixierte NSKF wird 
eine eigene Sequenz erstellt. Daher spielt es keine Rolle, 
ob an einem benachbarten Molekul die Synthese bereits 
weiter f ortgeschritten oder zuruckgeblieben ist. 

2. Es ist nicht notwendig, Molekule in einer definierten 
35 Anordnung auf der Oberflache zu fixieren, da das Signal von 

einzelnen Molekulen ausgeht und nicht von einer r&umlich 
definierten Population (was bei BASS-Methoden notwendig 
ist) . 
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Su. Detaillierte Besc hreibung 

4.1 Allgemeine Prinzipien der Reaktion 

5 

Im folgenden sollen anhand der Sequenzierung eines mehrere Mb 
langen DNA-Stuckes beispielhaft die allgemeinen Prinzipien der 
Reaktion dargestellt werden (Fig. 1) . Der Sequenzierung und der 
Rekonstruktion von Nukleinsaurensequenzen liegt das Shotgun- 

10 Prinzip zugrunde ("Automated DNA sequencing and analysis" S. 
231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom 
Res. 1999 v. 9 S.868, Huang Genomics 1996 v. 33 S.21, Bonfield et 
al. NAR 1995 v.23 S.4992, Miller et al. J.Comput.Biol. 1994 v.l 
S.257) . Die Sequenz eines langen DNA-Stucks wird dabei durch 

15 die Sequenzierung kleiner DNA-Fragmente und nachfolgender 
Rekonstruktion ermittelt. Das zu analysierende Material (1) 
wird fur die Sequenz ierungsreakt ion vorbereitet, indem es in 
Fragmente von vorzugsweise 50 bis 1000 bp Lange zerlegt wird 
(2) . Jedes Fragment wird anschlieSend mit einer 

20 Primerbindungsstelle und einem Primer versehen (3) . Dieses 
Gemisch aus verschiedenen DNA- Fragment en wird nun auf einer 
planen Oberf lache fixiert (4) . Die nicht gebundenen DNA- 
Fragmente werden durch einen Waschschritt entfernt. Danach wird 
die Sequenz ierungsreakt ion an der gesamten Reaktionsoberf lache 

25 durchgef \ihrt . Diese Reaktion verlauft zyklisch. Im 1. Schritt 
des Zyklus wird ein mit einem Fluoreszenzfarbstof f markiertes 
NT* in den wachsenden Strang eingebaut: Dabei wird die Reaktion 
so gesteuert, dass in jedem Zyklus jeweils nur ein markiertes 
NT* von einer Polymerase in den wachsenden Strang eingebaut 

30 werden kann. Das wird durch die Verwendung von NTs* erreicht, 
die eine reversibel gekoppelte, zur Termination fuhrende Gruppe 
tragen. Der Einbau eines weiteren markierten NT* wird dadurch 
unmoglich gemacht. Die Polymerase und die markierten NTs* werden 
gleichzeitig in die Reaktion eigesetzt (5) . Danach wird das 

35 Reaktionsgemisch entfernt und die OberflSche in geeigneter Art 
und Weise gewaschen (6). Nun folgt ein Detektionsschritt (7): 
Die Oberflache wird mit einer fxir die Einzelmolekttldetektion 
geeigneten Vorrichtung (bestehend aus Lichtquelle, Mikroskop, 
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Kamera, Scantisch, Computer mit Steuerungs- und Bilderkennungs- 
bzw. Bildverarbeitungssoftware) abgescannt und die Signale der 
einzelnen, eingebauten markierten NTs* identif iziert . Nach dem 
Detektionsschritt wird die Markiemng und die zur Termination 
5 fuhrende Gruppe von alien eingebauten NTs* entfernt (8) . Nach 
einem sich anschliefienden Waschschritt kann ein neuer Zyklus 
beginnen. Zur Rekonstruktion einer grofceren ursprunglichen 
DNA-Sequenz (z.B. mehrere Mb langes DNA- Stuck) sollen die DNA- 
Fragmente einige Hundert NT lang sein, falls man die 

10 Rekonstruktion nach dem Shotgun- Prinzip durchfuhrt ("Automated 
DNA sequencing and analysis" S. 231 ff. 1994 M. Adams et al. 
Academic Press, Huang et al. Genom Res, 1999 v. 9 S.868, Huang 
Genomics 1996 v. 33 S.21, Bonfield et al. NAR 1995 v. 23 S.4992, 
Miller et al. J . Comput . Biol . 1994 v.l S.257) . Da pro Zyklus nur 

15 jeweils ein markiertes NT* eingebaut wird, sind mindestens 300 
Zyklen zur Sequenzierung notwendig. 

4.2 Auswahl des Materials 

20 Mit Hilfe der erf indungsgemafien Methode ist es m&glich, sowohl 
vorselektionierte DNA-Sequenzen (z.B. in YAC- , PAC- , Oder BAC- 
Vektoren (R. Anand et al. NAR 1989 v. 17 S.3425, H. Shizuya et 
al. PNAS 1992 v. 89 S.8794, "Construction of bacterial 
artificial chromosome libraries using the modified PAC system" 

25 in "Current Protocols in Human genetics" 1996 John Wiley & Sons 
Inc.) klonierte Abschnitte eines Genoms) als auch nicht vor- 
selektionierte DNA (z.B. genomische DNA, cDNA-Gemische) zu 
analysieren. Durch eine Vorselektion ist es moglich, im Vorfeld 
relevante Inf ormationen, . wie z.B. Sequenz-Abschnitte aus einem 

30 Genom Oder Populationen an Genprodukten, aus der groSe Menge 
genetischer Informationen herauszuf iltern und damit die Menge 
der zu analysierenden Sequenzen einzuschranken. 

4.3 Vorbereitung des Materials 

35 

Ziel der Materialvorbereitung ist es, gebundene einzelstrangige 
NSKFs mit einer Lange von vorzugsweise 50-1000 NTs, einer 
einzelnen Primerbindungsstelle \and einem hybridisierten Primer 
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(gebundene NSKF-Primer-Komplexe) zu erhalten. Diese NSKF- 
Primer-Komplexe haben beispielsweise die in Fig. 2 dargestellte 
Struktur. Im einzelnen kdnnen sehr variable Konstruktionen aus 
dieser allgemeinen Struktur abgeleitet werden. Zur Verbesserung 
5 der Anschaulichkeit folgen nun einige Beispiele, wobei die 
angefiihrten Methoden einzeln Oder in Kombination eingesetzt 
werden konnen. 

4.3.1 Er zeugung kurzer Nukleinsaureket tenf ragmente (50-1000 
10 NTs) ( Fragment ierungsschritt) 

Wichtig ist, dass die Fragment ierung der NSKs so erfolgt, dass 
Fragmente erhalten werden, die uberlappende Teilsequenzen der 
Gesamtsequenzen darstellen. Dies wird durch Verfahren erreicht, 
15 bei denen unterschiedlich lange Fragmente als Spaltprodukte in 
zufallsm&6iger Verteilung entstehen. 

Erf indungsgemaS kann die Erzeugung der Nukleinsaureketten- 
f ragmente (NSKFs) durch mehrere Methoden erfolgen, z.B. durch 

20 die Fragmentierung des Ausgangsmaterials mit Ultraschall oder 
durch Endonukleasen ("Molecular cloning" 1989 J.Sambrook et 
al. Cold Spring Harbor Laborotary Press), wie z.B. durch 
unspezifische Endonukleasegemische. Erf indungsgemaS wird die 
Ultraschall-Fragmentierung bevorzugt. Man kann die Bedingungen 

25 so einstellen, dass Fragmente mit einer durchschnitt lichen 
Lange von 100 bp bis 1 kb entstehen. Diese Fragmente werden an- 
schliefiend an ihren Enden durch das Klenow- Fragment (E.coli- 
Polymerase I) oder durch die T4-DNA- Polymerase aufgefullt 
("Molecular cloning" 1989 J.Sambrook et al. Cold Spring Harbor 

30 Laborotary Press) . 

Ausserdem konnen aus einer langen NSK unter Verwendung randomi- 
sierter Primer komplementare kurze NSKFs synthetisiert werden. 
Besonders bevorzugt wird diese Methode bei der Analyse der Gen- 
35 Sequenzen. Dabei werden an der mRNA einzelstrSngige DNA- 
Fragmente mit randomisierten Primern und einer reversen 
Trauiskriptase gebildet (Zhang- J et al. Biochem.J. 1999 v. 337 
S.231, Ledbetter et al. J.Biol.Chem. 1994 v. 269 S. 31544, Kolls 
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et al. Anal.Biochem. 1993 v. 208 S.264, Decraene et al. 
Biotechniques 1999 v. 27 S.962). 

4.3.2 Einftihrung einer Primerbindungsstelle in das NSKF. 

5 

Die Primerbindungsstelle (PBS) ist ein Sequenzabschnitt, der 
eine selektive Bindung des Primers an das NSKF ermoglichen 
soil. 

10 In einer Aus ftihrungs form k6nnen die Primerbindungsstellen 
unterschiedlich sein, so dass mehrere unterschiedlche Primer 
verwendet werden mussen. In diesem Fall konnen bestimmte 
Sequenzabschnitte der Gesamtsequez als naturliche PBSs fur 
spezifische Primer dienen. Diese Ausfuhrungsform ist besonders 

15 fxir die Untersuchung bereits bekannter SNP-Stellen geeignet, s. 
Beispiel 5 "SNP-Analyse mit sequenzspezif ischen Primern" . 

In einer anderen Ausfuhnangsform ist es aus Grflnden der 
Vereinfachung der Analyse gunstig, wenn eine einheitliche 
20 Primerbindungsstelle in alien NSKFs vorhanden ist. GemaS einer 
bevorzugten Aus fuhrungs form der Erfindung werden die 
Primerbindungsstellen daher in die NSKFs extra eingefilhrt. Auf 
diese Weise kdnnen Primer mit einheitlicher Struktur fur die 
Reaktion eingesetzt werden. 

25 

Im folgenden wird diese Aus fuhrungs form detailliert 
beschrieben. 

Die Zusammensetzung der Primerbindiangsstelle ist nicht einge- 
30 schrankt. Ihre Lange betragt vorzugsweise zwischen 20 und 50 
NTs. Die Primerbindungsstelle kann eine funktionelle Gruppe zur 
Immobilisation des NSKF tragen. Diese funktionelle Gruppe kann 
z.B. eine Biotingruppe sein. 

35 Als Beispiel fur die Einfuhrung einer einheitlichen 
Primerbindungsstelle werden im folgenden die Ligation und das 
Nukleotid-Tailing an DNA-Fragmente beschrieben. 



WO 02/088382 



PCT/EP02/04659 



- 19 - 

a) Ligation: 

Dabei wird ein doppelstrangiger Oligonukleotidkomplex mit einer 
Primerbindungsstelle verwendet (Fig. 3a) . Dieser wird mit kom- 
merziell erhSltlichen Ligasen an die DNA-Fragmente ligiert 
5 ("Molecular cloning" 1989 J.Sambrook et al. Cold Spring Harbor 
Laborotary Press) . Es ist wichtig, dass nur eine einzige 
Primerbindungsstelle an das DNA-Fragment ligiert wird. Das 
erreicht man z.B. durch eine Modifikation einer Seite des 
Oligonukleotidkomplexes an beiden Strangen (Fig. 3b) . Die 

10 Resultate nach der Ligation bzw. nach anschlieSender 
Denaturierung sind in Fig. 3c und 3d dargestellt. Die 
modifizierenden Gruppen am Oligonukleotidkompex konnen zur 
Immobilisation dienen. Die Synthese und die Modifikation eines 
solchen Oligonukleotidkomplexes kann nach standardisierten 

15 Vorschriften durchgefuhrt werden. Zur Synthese kann z.B. der 
DNA-Synthesizer 380 A Applied Biosystems verwendet werden. 
Oligonucleotide mit einer bestimmten Zusammensetzung mit oder 
ohne Modif ikationen sind aber auch als Auftragssynthese 
kommerziell erhaltlich, z.B. von MWG-Biotech GmbH, Germany. 

20 

b) Nukleotid-Tailing: 

Statt der Ligation mit einem Oligonukleotid kann man mit einer 
terminalen Deoxynucleotidyltransf erase mehrere (z.B. zwischen 
10 und 20) Nukleosid-monophosphate an das 3 ' -Ende eines ss-DNA- 

25 Fragments anknupfen ("Molecular cloning" 1989 J.Sambrook et al. 
Cold Spring Harbor Laborotary Press, "Method in Enzymology" 
1999 v. 303, S. 37-38) (Fig. 4), z.B. mehrere Guanosin- 
Monophosphate ( (G) n- Tailing genannt) . Das entstehende Fragment 
wird zur Bindung des Primers, in diesem Beispiel eines (C)n- 

30 Primers, verwendet. 

4.3.3 Einzelstrang- Vorbereitung 

Fur die Sequenzierungsreaktion werden einzelstrangige NSKFs 
35 benotigt. Falls das Ausgangsmaterial in doppelstrangiger Form 
vorliegt, gibt es mehrere Moglichkeiten, aus doppelstrangiger 
DNA eine einzelstrangige Form zu erzeugen (z.B. Hitze- 
Denaturierung oder Alkali-Denaturierung) ("Molecular cloning" 



WO 02/0&8382 



PCT/EP02/04659 



- 20 - 

1989 J.Sambrook et al. Cold Spring Harbor Laborotary Press) . 

4.3,4 Primer fur die Sequenzierungsreaktion 

5 Dieser hat die Funktion, den Start an einer einzigen Stelle des 
NSKF zu ermoglichen. Er bindet an die Primerbindungsstelle im 
NSKF. Die Zusammensetzung und die Lange des Primers sind nicht 
eingeschrctnkt . Aufier der Start funktion kann der Primer auch 
andere Funktionen libernehmen, wie z.B. eine Verbindung zur 
10 Reaktionsoberflache zu schaffen. Primer sollten so an die Lange 
und Zusammensetzung der Primerbindungsstelle angepaSt werden, 
dass der Primer den Start der Sequenzierungsreaktion mit der 
jeweiligen Polymerase ermoglicht. 

15 Bei der Verwendung unterschiedlicher, beispielsweise naturlich 
in der ursprunglichen Gesamtsequenz vorkommender 
Primerbindungsstellen, werden die fur die jeweilige 
Primerbindungsstelle sequenzspezif ischen Primer verwendet. In 
diesem Fall wird fur die Sequenzierung ein Primergemisch 

20 eingesetzt. 

Bei einer einheitlichen, beispielsweise durch die Ligation an 
die NSKFs angekoppelten Primerbindungsstelle wird ein 
einheitlicher Primer verwendet. 

25 

Vorzugsweise betragt die Lange des Primers zwischen 6 und 100 
NTs, optimalerweise zwischen 15 und 30 NTs. Der Primer kann 
eine Funktionsgruppe tragen, die zur Immobilisierung des NSKF 
dient, beispielsweise ist eine solche Funktionsgruppe eine 

30 Biotingruppe (s. Abschnitt Immobilisierung). Sie soli die 
Sequenzierung nicht storen. Die Synthese eines solchen Primers 
kann z.B. mit dem DNA-Synthesizer 380 A Applied Biosystems 
ausgefuhrt werden oder . aber als Auf tragssynthese bei einem 
kommerziellen Anbieter, z.B. MWG-Biotech GmbH, Germany erstellt 

35 werden) . 

Der Primer kann vor der Hybridisierung an die zu analysierenden 
NSKFs auf der Oberflache mit verschiedenen Techniken fixiert 
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Oder direkt auf der Oberflache synthetisiert werden, 
beispielsweise nach (McGall et al. US Patent 5412087, Barrett 
et al. US Patent 5482867, Mirzabekov et al. US Patent 5981734, 
"Microarray biochip technology" 2000 M.Schena Eaton Publishing;,!- 
5 "DNA Microarrays" 1999 M. Schena Oxford University Press, Fodor 
et al. Science 1991 v. 285 S.767, Timofeev et al. Nucleic Acid 
Research (NAR) 1996, v. 24 S.3142, Ghosh et al. NAR 1987 v/15 
S.5353, Gingeras et al. NAR 1987 v. 15 S.5373, Maskos et al. NAR 
1992 V.20 S.1679) . 

10 

Die Primer werden auf der Oberflache beispielsweise in einer 
Dichte zwischen 10 bis 100 pro 100 ym 2 , 100 bis 10.000 pro 100 
fiia 2 oder 10.000 bis 1.000.000 pro lOO^m 2 gebunden. 

15 Der Primer oder das Primergemisch wird mit NSKFs unter Hybridi- 
sierungsbedingungen inkubiert, die ihn selektiv an die 
Primerbindungsstelle des NSKF binden lassen. Diese Primer - 
Hybridisierung (Annealing) kann vor (1), w^hrend (2) oder nach 
(3) der Bindung der NSKFs an die Oberflache erfolgen. Die 

20 Optimierung der Hybridisierungsbedingungen hangt von der 
genauen Struktur der Primerbindungsstelle und des Primers ab 
und laSt sich nach Rychlik et al. NAR 1990 v. 18 S.6409 
berechnen. Im folgenden werden diese Hybridisierungsbedingungen 
als standardisierte Hybridisierungsbedingungen bezeichnet. 

25 

Falls eine fur alle NSKFs gemeinsame Primerbindungsstelle mit 
bekannter Struktur beispielsweise durch Ligation eigefuhrt 
wird, kdnnen Primer mit einheitlicher Struktur eingesetzt 
werden. Die Primerbindungsstelle kann an ihrem 3 ■ -Ende eine 
30 funktionelle Gruppe tragen, die z.B. zur Immobilisation dient. 
Beispielsweise ist diese Gruppe eine Biotin-Gruppe . Der Primer 
hat eine zur Primerbindungsstelle komplementare Struktur. 

Ein Beispiel einer Primerbindungstelle und eines Primers ist 
35 nachfolgend dargestellt. 

5 ' TAATACGACTCACTATAGG3 1 Primer ( T7 - 1 9 - Primer ) 
Biot in- 3 1 ATTATGCTGAGTGATATCC5 1 Primerbindungss telle 
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4.3.5 Fixierung von NSKF-Primer-Komplexe an die Oberflache 
(Bindung bzw. Immobilisierung von NSKFs) . 

5 Ziel der Fixierung (Immobilisierung) ist es, NSKF - Primer - ^ * 
Komplexe auf einer geeigneten planen Oberflache in einer Art 
und Weise zu fixieren, dass eine zyklische enzymatische 
Seguenzierungsreaktion ablaufen kann. Dies kann beispielsweise 
durch Bindung des Primers (s.o.) oder des NSKF an die 
10 Oberflache erfolgen. 

Die Reihenfolge der Schritte bei der Fixierung von NSKF-Primer- 
Komplexen kann variabel sein: 

1) Die NSKF-Primer-Komplexe konnen zunachst in einer Ldsung 
durch Hybridisierung (Annealing) gebildet und 
anschlieSend an die Oberflache gebunden werden. 

2) Primer konnen zunachst auf einer Oberflache gebunden 
werden und NSKFs anschliefiend an die gebundenen Primer 
hybridisiert werden, wobei NSKF -Primer -Komplexe entstehen 
(NSKFs indirekt an die Oberflache gebunden) 

3) Die NSKFs k6nnen zunachst an die Oberflache gebunden 
werden (NSKFs direkt an die Oberflache gebunden) und im 
anschliefienden Schritt die Primer an die gebundenen NSKFs 
hybridisiert werden, wobei NSKF-Primer-Komplexe enstehen. 

25 Die Immobilisierung der NSKFs an die Oberflache kann daher 
durch direkte oder indirekte Bindung erfolgen. 

Oberflache und Reaktionsoberf lache sind vorliegend als 
gleichwertige Begriffe aufzufassen, auSer wenn explizit auf 

30 eine andere Bedeutung hingewiesen wird. Als Reaktionsoberf lache 
dient die Oberflache einer festen Phase eines beliebigen 
Materials. Dieses Material ist vorzugsweise enzymatischen 
Reaktionen gegeniiber inert und verursacht keine Storungen der 
Detektion. Silicon, Glas, Keramik, Kunststoff (z.B. 

35 Polycarbonate oder Polystyrole) , Metall (Gold, Silber, oder 
Alluminium) oder beliebiges anderes Material, das diesen 
funktionellen Anforderungen genugt, kann verwendet werden. 
Vorzugsweise ist die Oberflache nicht verformbar, denn sonst 



15 



20 
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ist mit einer Verzerrung der Signale bei der wiederholten 
Detektion zu rechnen. 



Falls eine gelartige feste Phase (Oberflache eines Gels) 
5 verwendet wird, so kann dieses Gel z.B. ein Agarose- oder 
Polyacrylamidgel sein. Das Gel ist vorzugsweise fur Molekiile 
mit einer Molekularmasse unter 5000 Da frei passierbar 
(beispielsweise kann ein 1 bis 2% Agarose-Gel oder 10 bis 15% 
Polyacrylamid Gel verwendet werden) . Eine solche Geloberf lache 

10 hat anderen festen Oberflachen gegenuber den Vorteil, dass es 
zu einer wesentlich geringeren unspezif ischen Bindung von NT*s 
an die Oberflache kommt. Durch die Bindung der NSKF-Primer- 
Komplexe auf der Oberflache ist die Detektion der 
Fluoreszenzsignale von eingebauten NTs* moglich. Die Signale von 

15 freien NTs* werden nicht detektiert, weil sie nicht an das 
Material des Gels binden und somit nicht immobilisiert werden. 
Das Gel ist vorzugsweise auf einer festen Unterlage befestigt 
(Fig. 5a) . Diese feste Unterlage kann Silicon, Glas # Keramik, 
Kunststoff (z.B. Polycarbonate oder Polystyrole) , Metall (Gold, 

20 Silber, oder Alluminium) oder beliebiges anderes Material sein. 
Die Dicke des Gels betragt vorzugsweise nicht mehr als 0,1 mm. 
Die Geldicke ist vorzugsweise groSer als die einfache 
Tiefenscharfe des Objektivs sein, damit unspezif isch an die 
feste Unterlage gebundene NTs* nicht in die Fokusebene gelangen 

25 und damit detektiert werden. Wenn die Tiefenscharfe z.B. 0,3 pm 
betragt, so liegt die Geldicke vorzugsweise zwischen 1 pm und 
100 pm. Die Oberflache kann als eine kontinuierliche Oberflache 
oder als diskontinuierliche, aus einzelnen kleinen 
Bestandteilen (z.B. Agarose -Kugelchen) zusammengesetzte Ober- 

30 f lache hergestellt werden (Fig. 5b) . Die Reaktionsoberf lache mufc 
groS genug sein, urn die notwendige Anzahl der NSKFs bei 
entsprechender Dichte immobilisieren zu konnen. Die Reaktions- 
oberfl&che sollte vorzugsweise nicht groSer als 20 cm 2 sein. 

35 Die verschiedenen Zyklusschritte erfordern einen Austausch der 
unterschiedlichen Reaktionslosungen iiber der Oberflache. Die 
Reaktionsoberf lache ist vorzugsweise Bestandteil eines 
Reaktionsgef afies . Das ReaktionsgefaS ist wiederum vorzugsweise 
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Bestandteil einer Reaktionsapparatur mit Durchf luSvorr ichtung . 
Die Durchflufivorrichtung ermoglicht einen Austausch der 
Losungen im Reaktionsgefafi. Der Austausch kann mit einer durch 
einen Computer gesteuerten Pumpvorrichtung Oder manuell 
5 erfolgen. Wichtig dabei ist, dass die Oberfl&che nicht 
austrocknet. Vorzugsweise betragt das Volumen des 
Reaktionsgefafies weniger als 50 Idealerweise betragt sein 

Volumen weniger als 1 Ein Beispiel eines solchen 

Duchf luSsystems ist in Fig. 6 gegeben. 

10 

Falls die Fixierung der NSKF-Primer-Komplexe auf der Oberflache 
uber die NSKFs erfolgt, kann dies beispielsweise durch die 
Bindung der NSKFs an einem der beiden Ketten-Enden erfolgen. 
Dies kann durch entsprechende kovalente, affine oder andere 

15 Bindungen erreicht werden. Es sind viele Beispiele der 
Immobilisierung von Nukleinsauren bekannt (McGall et al. US 
Patent 5412087, Nikiforov et al. US Patent 5610287, Barrett et 
al, US Patent 5482867, Mirzabekov et al. US Patent 5981734, 
"Microarray biochip technology" 2000 M.Schena Eaton Publishing, 

20 "DNA Microarrays" 1999 M. Schena Oxford University Press, 
Rasmussen et al. Analytical Biochemistry v. 198, S.138, Allemand 
et al. Biophysical Journal 1997, v. 73, S.2064, Trabesinger et 
al. Analytical Chemistry 1999, v. 71, S.279, Osborne et al. 
Analytical Chemistry 2000, v. 72, S.3678, Timofeev et al. 

25 Nucleic Acid Research (NAR) 1996, v. 24 S.3142, Ghosh et al. NAR 
1987 v.15 S.5353, Gingeras et al. NAR 1987 v. 15 S.5373, Maskos 
et al. NAR 1992 v.20 S.1679). Die Fixierung kann auch durch 
eine unspezif ische Bindung, wie z.B. durch Austrocknung der 
NSKFs enthaltenden Probe auf der planen Oberflache erreicht 

30 werden. 

Die NSKFs werden auf der Oberflache beispielsweise in einer 
Dichte zwischen 10 und 100 NSKFs pro 100 pm 2 , 100 bis 10.000 pro 
100 fim 2 , 10.000 bis 1.000.000 pro lOOjim 2 gebunden. 

35 

Die fur die Detektion notwendige Dichte von extensionsfahigen 
NSKF-Primer-Komplexen betragt ca. 10 bis 100 pro 100 jon 2 . Sie 
kann vor, wahrend oder nach der Hybridisierung der Primer an 
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die Genprodukte erreicht werden. 

Beispielhaft werden im folgenden einige Methoden zur Bindung 
von NSKF- Primer -Komplexen naher dargestellt: In einer Aus- 
5 fOhrungsform erfolgt die Iinmobilisierung der NSKFs uber Biotin- 
Avidin Oder Biotin-Streptavidin-Bindung. Dabei wird Avidin oder 
Streptavidin auf der Oberflache kovalent gebunden, das S'-Ende 
des Primers enthalt Biotin. Nach der Hybridisierung der 
markierten Primer mit den NSKFs (in Losung) werden diese auf 
10 der mit Avidin/Streptavidin beschichteten Oberflache fixiert. 
Die Konzentration der mit Biotin markierten Hybridisierungs- 
Produkte sowie die Zeit der Inkubation dieser Losung mit der 
Oberflache wird so gewahlt, dass eine fur die Sequenzierung 
geeignete Dichte bereits in diesem Schritt erreicht wird. 

15 

In einer anderen bevorzugten Ausfuhrungsform werden die fur die 
Sequenzierungsreaktion geeigneten Primer vor der 
Sequenzierungsreaktion auf der Oberflache mit geeigneten 
Methoden fixiert (s.o.). Die einzelstr&ngigen NSKFs mit jeweils 

20 einer Primerbindungss telle pro NSKF werden damit unter 
Hybridisierungsbedingungen inkubiert (Annealing) . Dabei binden 
sie an die fixierten Primer und werden dadurch gebunden 
(indirekte Bindung) , wobei Primer-NSKF-Komplexe entstehen. Die 
Konzentration der einzelstrSngigen NSKFs und die 

25 Hybridisierungsbedingungen werden so gewcihlt, dass man eine fur 
die Sequenzierung geeignete Immobilisationsdichte von 10 bis 
100 ext ens ions f Shi gen NSKF-Primer-Komplexen pro 100 pm 2 
erreicht. Nach der Hybridisierung werden ungebundene NSKFs 
durch einen Waschschritt entfernt. Bei dieser Ausfiihrungsf orm 

30 wird eine Oberflache mit einer hohen Primerdichte bevorzugt, 
z.B. ca. 1.000.000 Primer pro 100/an 2 oder noch hoher, da die 
gewunschte Dichte an NSKF-Primer-Komplexen schneller erreicht 
wird, wobei die NSKFs nur an einen Teil der Primer binden. 

35 In einer anderen Ausfuhrungsform werden die NSKFs an die 
Oberflache direkt gebunden (s.o.) und anschlieSend mit Primern 
unter Hybridisierungsbedingungen inkubiert. Bei einer Dichte 
von ca. 10 bis 100 NSKFs pro 100/xm 2 wird man versuchen alle 
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verfiigbaren NSKFs mit eineni Primer zu versehen und fur die 
Sequenzierugnsreaktion verfugbar zu machen. Dies kann z.B. 
durch hohe Primerkonzentration, beispielsweise 1 bis 100 
mmol/1, erreicht werden. Bei einer hoheren Dichte der fixierten 
5 NSKFs auf der Oberflache, beispielsweise 10.000 bis 1.000.000 
pro 100/xm 2 , kann die fur die optische Detektion notwendige 
Dichte der NSKF-Primer-Komplexe wahrend der Primer - 
Hybridisierung erreicht werden. Dabei sind die 
Hybridisierungsbedingungen (z.B. Temperatur , Zeit , Puffer, 
10 Primerkonzentration) so zu wahlen, dass die Primer nur an 
einen Teil der immobilisierten NSKFs binden, s. Beispiel 5,6. 

Falls die Oberflache einer festen Phase (z.B. Silikon oder 
Glas) zur Immobilisation verwendet wird, wird vorzugsweise eine 
15 Blockierungslosung auf die Oberflache vor dem Schritt (a) in 
jedem Zyklus gebracht, die zur Vermeidung einer unspezif ischen 
Adsorbtion von NTs* an der Oberflache dient. Diese Bedingungen 
fur eine Blockierlosung erfullt beispielsweise eine 
Albuminlosung (BSA) mit einem pH-Wert zwischen 8 und 10. 

20 

4.4 Wahl der Polymerase 

Als Polymerasen eignen sich prinzipiell alle DNA-abhangigen 
DNA-Polymerasen ohne 3' -5 1 Exonuklease-Aktivitat (DNA- 

25 Replication" 1992 Ed. A. Romberg, Freeman and company NY), z.B. 
modifizierte T7-Polymerase vom Typ "Sequenase Version 2" 
(Amersham Pharmacia Biotech), B'-S 1 exonuklease freies Klenow 
Fragment der DNA- Polymerase I (Amersham Pharmacia Biotech) , 
Polymerase Beta verschiedenen Ursprungs (Animal Cell DNA 

30 Polymerases" 1983, Fry M. , CRC Press Inc., kommerziell 
erhaltlich bei Chimerx) thermostabile Polymerasen wie 
beispielsweise Taq- Polymerase (GibcoBRL) , proHATM Polymerase 
(Eurogentech) . 

35 Polymerasen mit 3^5* Exonuklease-Aktivitat k6nnen eingesetzt 
werden (z.B. Klenow- Fragment der B. col i- Polymerase I), sofern 
Reaktionsbedingungen gewahlt werden, die vorhandene B'-S 1 
Exonuklease-Aktivitat \anterdriicken, wie z.B. ein niedriger pH- 
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Wert (pH 6.5) beim Klenow- Fragment (Lehman and Richardson, J. 
Biol. Chem. 1964 v. 239 S.233) Oder Zugabe von NaF zur 
Einbaureaktion. Eine andere M6glichkeit besteht in der 
Verwendung von NTs* mit einer Phosphorothioate-Verbindung 
5 (Kunkel et al. PNAS 1981, v. 78 S.6734). Dabei werden eingebaute 
NTs* von der S'-S 1 Exonuklease-Aktivitat der Polymerase nicht 
angegriffen. Im folgenden werden all diese Polymerasearten als 
" Polymerase 11 bezeichnet . 

10 4.5 Chemie 

4.5.1 Allgemeines Prinzip 

Fur die Sequenzierungsreaktion bei hoch paralleler 
15 Sequenzanalyse an einzelnen Nukleins&ure-Molekulen (parallele 
Analyse von bis zu 10.000.000 NSKF-Sequenzen) ist wichtig, dass 
jedes eingebaute NT* identif iziert wird. Eine Voraussetzung 
dafur ist, dass nur ein einziges NT* pro Zyklus in die 
Nukleinsaurekette eingebaut wird. Falls eine Polymerase mehrere 
20 NTs* nacheinander im selben Zyklus einbaut, so fuhrt dies zu 
einem Fehler in der Sequenzermittlung. Aus diesem Grund mufi man 
den Einbau der NTs* steuern. 

Beispielsweise wurden in der BASS-Methode reversible 3 1 -OH 
modifizierte NTs beschirieben (Dower US Patent 5.547.839, Canard 

25 et al. US Patent 5.798.210, Rasolonjatovo Nucleosides & 
Nucleotides 1999, v. 18 S.1021, Metzker et al. NAR 1994, v. 22, 
S.4259, Welch et al. Nucleosides & Nucleotides 1999, v. 18, 
S.197) . Die Spaltung soli dabei unter milden Bedingungen 
photochemisch (Dower US Patent 5.547.839, Welch et al. 

30 Nucleosides & Nucleotides 1999, v. 18, S.197) Oder chemisch 
(Canard et al. US Patent 5.798.210, Rasolonjatovo Nucleosides & 
Nucleotides 1999, v. 18 S.1021) erfolgen. 

Die Synthese der 3 ' -OH-modif izierten photochemisch spaltbaren 
35 NTs* ist sehr aufwendig. Die Polymerasen weisen eine sehr unter- 
schiedliche Affinitat zu diesen Nukleotidanalogen auf, so dass 
die Nukleinsauresynthese sehr ungleichmafcig bzw. an vielen DNA- 
Stellen gar nicht ablauft (Metzker et al. NAR 1994 v. 22 S.4259, 
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Welch et al. Nucleosides & Nucleotides 1999, v. 18 S.197). Aus 
diesen Grunden eignen sich diese Analoga nicht oder nur sehr 
eingeschrankt fur die Sequenzierungsreaktion. Eine spaltbare 
3'-Ester-Verknupfung (Canard et al. US Patent 5.798.210) kommt 
5 als Grundlage fur eine reversible Termination der Synthese auch 
nicht in Betracht. Die meisten Polymerasen spalten bei 
Verfugbarkeit eines nachsten komplementaren NT 3'-OH-Ester- 
Verbindungen, so dass die an die 3'-OH-Gruppe gebundene 
Markierung in die Losung freigesetzt wird und nicht mehr als 

10 Terminator wirken kann (Rasolonjatovo et al. Nucleosides & 
Nucleotides 1999, v. 18 S.1021, Canard et al. PNAS 1995 v. 92 
S. 10859). In Positionen, an denen eine Polymerase mehrere 
gleiche NTs* nacheinander einbauen kann, fuhrt das zu einem 
fehlerhaften Signal. Im AbschluISbericht des BMBF- 

15 Verbundsprojekts „Sequenzierung mit Mult iplexfarbstof fen und 
Kapillarelektrophorese" G. Sagner, 1999, wurde berichtet, dass 
Modif ikationen der 3' -Position von Nukleotiden zur Aufhebung 
ihrer Substrateigenschaf ten fiir Polymerasen gefiihrt haben. 

20 Die Schwierigkeiten bei der Entwicklung passender NT-Analoga 
fur das Verfahren basieren auf folgenden Rahmenbedingungen: 

1) Die Reaktion muss so gesteuert werden, dass die Polymerase 
NT*s einzeln einbaut (Stop des weiteren Einbaus) . 

2) NT*s miissen einen Farbstoff tragen, der den Anforderungen 
25 der Detektion geniigt. 

3) Der Farbstoff mufi unter milden Bedingungen abspaltbar 
sein, so dass weder die NSKF- Primer- Komplexe, noch 
einzelne Komponenten des Systems beschadigt werden. 

4) Die Abspaltung muss mSglichst schnell und quantitativ 
30 erfolgen. 

5) Der Stop des Einbaus muss reversibel sein und unter milden 
Bedingungen aufgehoben werden konnen. 

Bis jetzt wurde keine praktisch brauchbare L6sung fur diese 
35 Probleme in der einschlagigen Literatur vorgestellt. 



Durch die vorliegende Erfindung werden nunmehr die im Stand 
der Technik bekannten Probleme erstmals gel6st. Erf indungsgemSS 
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werden fur die Sequenzierung NTs* mit einer sterisch 
anspruchsvollen Gruppe an der Base verwendet. 

Eine an die Base gekoppelte sterisch anspruchs voile Gruppe kann 
5 zur Behinderung der weiteren Synthese fiihren, wobei diese 
Behinderung in der Fachliteratur als unerwunschte Eigenschaft 
modif izierter NTs bei der Markierung von Nukleinsauren 
angesehen wird. Biotin, Digoxigenin und Fluoreszenzfarbstof fe 
wie Fluoreszein, Tetramethylrhodamine , Cy3-Farbstof f stellen 
10 Beispiele einer solchen sterisch anspruchsvollen Gruppe dar 
(Zhu et al. Cytometry 1997, v. 28, S.206, Zhu et al. NAR 1994 , 
v. 22, S.3418, Gebeyehu et al., NAR 1987, v. 15, S.4513, Wiemann 
et al. Analytical Biochemistry 1996, v. 234, S.166, Heer et al. 
BioTechniques 1994 v. 16 S.54) . 

15 

Bei der Sequenzierungsreaktion im erf indungsgemSEen Verfahren 
werden markierte NTs* mit einer Polymerase und Nukleinsaureket- 
ten inkubiert. Die NTs* tragen dabei eine an die Base reversibel 
gekoppelte sterisch anspruchsvolle Gruppe. Wenn ein Reaktions- 

20 gemisch, das nur modif izierte NTs* enthalt, in der Reaktion 
eingesetzt wird, dann kann die Polymerase nur ein einziges NT* 
einbauen. Der Einbau eines n&chsten NT* wird sterisch gehemmt. 
Diese NTs* treten somit als Terminatoren der Synthese auf . Nach 
der Entfernung der sterisch anspruchsvollen Gruppe kann das 

25 nachste komplementare NT* eingebaut werden. Weil diese NTs* kein 
absolutes Hindernis zur weiteren Synthese darstellen, sondern 
nur fiir den Einbau eines weiteren markierten NT*, werden sie als 
Semiterminatoren bezeichnet . 

30 Der Unterschied zur 3 f -0H Terminatoren-Methode besteht darin, 
dass nicht eine Blockade der fur die Synthese notwendigen 3 1 -OH 
Gruppe angestrebt wird, sondern eine an die Base geknupfte 
Gruppe als sterisches Hindernis fur den weiteren Einbau genutzt 
wird. Die 3' -OH Gruppe bleibt dabei die ganze Zeit frei. 

35 

4.5.2 Allgemeine Struktur des NT* 



Ihre gemeinsamen Merkmale sind in Fig. 7a,b,d dargestellt. 
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Diese Struktur ist dadurch charakterisiert, dass an der Base 
tiber einen spaltbaren Linker (A-E) eine sterische Gruppe (D) 
und der Fluoreszenzmarker (F) gebunden sind. 

5 Als Grundlage fur die NTs* dienen Deoxynukleosid-Triphosphate 
mit Adenosin (A), Guanosin(G), Cytidin (C) und Thymidin (T) als 
Nukleosidrest. Anstelle von Thymidin wird bevorzugt Uridin als 
Nukleosidrest verwendet. Anstelle von Guanosin kann Inosin ver- 
wendet werden. 

10 

4.5.3 Marker, Fluorophore 

Jede Base ist mit einem fur sie charakteristischen Marker (F) 
markiert (Fig. 7) . Der Marker ist ein f luoreszierender Farb- 
15 stoff. Mehrere Faktoren beeinflussen die Wahl des Fluoreszenz- 
farbstoffes. Die Wahl ist nicht eingeschrankt , sofern der Farb- 
stoff folgenden Anforderungen genugt: 

a) Die verwendete Detektionsapparatur mu£ diesen Marker als 
20 einziges Molekul gebunden an DNA unter milden Bedingungen (vor- 

zugsweise Reaktionsbedingungen) identif izieren konnen. Die 
Farbstoffe haben vorzugsweise groSe Photos tabili tat . Ihre 
Fluoreszenz wird vorzugsweise von der DNA nicht oder nur 
unwesentlich gequencht. 

25 

b) Der an das NT gebundene Farbstoff darf keine irreversible 
Stdrung der enzymatischen Reaktion verursachen. 

c) mit dem Farbstoff markierte NTs* mussen von der Polymerase in 
30 die Nukleinsaurekette eingebaut werden. 

d) Bei einer Markierung mit verschiedenen Farbstoffen sollen 
diese Farbstoffe keine betrachtlichen Uberlappungen in ihren 
Emissionsspektren aufweisen. 

35 

Im Rahmen der vorliegenden Erfindung verwendbare 
Fluoreszenzfarbstof fe sind in "Handbook of Fluorescent Probes 
und Research Chemicals" 6th ed. 1996, R.Haugland, Molecular 
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Probes mit Strukturf ormeln zusammengestellt . Erf indungsgemafc 
werden vorzugsweise folgende Farbstof fklassen als Marker 
eingesetzt: Cyanin-Farbstof fe und deren Abk6mmlinge (z.B. Cy2, 
Cy3, Cy5, Cy7 Amersham Pharmacia Biotech, Waggoner US- Patent 
5 5.268.486), Rhodamine und deren Abkommlinge (z.B. TAMRA, TRITC # 
RG6, R110, ROX, Molecular Probes, s. Handbuch) , Xanthene- 
Derivate (z.B. Alexa 568, Alexa 594, Molecular Probes, Mao et 
al. US-Patent 6.130.101). Diese Farbstoffe sind kommerziell 
erh&ltlich. 

10 

Dabei kann man je nach spektralen Eigenschaften und vorhandener 
Apparatur entsprechende Farbstoffe ausw&hlen. Die Farbstoffe 
werden an den Linker z.B. uber Thiocyanat- oder Ester-Bindung 
gekoppelt ("Handbook of Fluorescent Probes und Research Chemi- 
15 cals" 6th ed. 1996, R.Haugland, Molecular Probes, Jameson et 
al. Methods in Enzymology 1997 v. 278 S.363, Waggon^r'^Methods in 
Enzymology 1995 v. 246 S.362), s. Beispiele 1 und. 2. 

4.5.4 Natur der sterisch anspruchsvollen Gruppe . ^ ^ *~ 

20 

Die Gruppe (D) (Fig. 7a,b,d) stellt ein Hinderniq -'fur den 
Einbau eines weiteren komplementareh 'markierten NT"' durch eine 
Polymerase dar. Biotin, Digoxigenin und Fluoreszenzfarbstof f e 
stellen Beispiele einer solchen sterisch anspruchsvollen Gruppe 

25 dar (Zhu et al. Cytometry 1997, v. 28, S.206, Zhu et al. NAR 
1994, v.22, S.3418, Gebeyehu et al., NAR 1987, v. 15, S.4513, 
Wiemann et al. Analytical Biochemistry 1996, v. 234, S.166, Heer 
et al. BioTechniques 1994 v. 16 S.54). Die chemische Struktur 
dieser Gruppe ist nicht eingeschrankt , sofern sie den Einbau 

30 des markierten NT*, an das sie gekniipft ist, nicht wesentlich 
stort und keine irreversible Stdrung der enzymatischen Reaktion 
verursacht . 

Diese Gruppe kann als selbstandiger Teil im Linker (7a) auf- 
35 treten oder mit dem Farbstoff (7b) oder der spaltbaren Gruppe 
(7d) identisch sein. Durch die Spaltung des Linkers wird diese 
sterisch anspruchs voile Gruppe (D) nach der Detektion des Si- 
gnals entfernt, so dass die Polymerase ein weiteres markiertes 
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NT* einbauen kann. Bei einer Struktur wie in 7d wird die steri- 
sche Gruppe durch die Spaltung beseitigt. 

5 In einer bevorzugten AusfClhrungsform ubernimmt der Fluoreszenz- 
farbstoff die Funktion einer solchen sterisch anspruchsvollen 
Gruppe # so dass ein markiertes Nukleotid eine in Fig. 7b,k,l 
dargestellte Struktur aufweist. 

10 In einer anderen bevorzugten AusfCdirungsform ubernimmt die 
photolabile spaltbare Gruppe die Funktion einer solchen 
sterisch anspruchsvollen Gruppe (Fig. 7d) . 

4.5.5 Linker 

15 

Der Marker (Fluoreszenzfarbstof f ) ist an die Base vorzugsweise 
uber einen Abstandhalter unterschiedlicher Lange, einen sog. 
Linker, gebunden. Beispiele f\ir Linker sind in Fig. 
7e, f ,h, i, j ,k, l,m gegeben. Vorzugsweise ist dieser Linker an 

20 einer der Stellen an die Base gebunden, die nicht an der 
Basenpaarung teilnimmt. Im bevorzugten Fall sind die Stellen, 
an die der Linker gebunden ist: die 5 -Position im Pyrimidinring 
und die 7 -Position oder 8 -Position im Purinring. Beispiele der 
Ankoppelung eines Linkers an die Base k6nnen aus folgenden 

25 Quellen entnommen werden (Hobbs et al. US Patent 5.047.519, 
Khan et al. US Patent 5.821.356, Hanna M. Method in Enzymology 
1996 v.274, S.403, Zhu et al. NAR 1994 v. 22 S.3418, Herman et 
al. Methods in Enzymology 1990 v. 184 S.584, J.L.Ruth et al. 
Molecular Pharmacology 1981 v. 20 S.415, L. Otvos et al. NAR 

30 1987 v.15 S.1763, G.E.Wright et al . Pharmac Ther. 1990 v. 47, 
S.447, „Nucleotide Analogs; Synthesis and Biological Function" 
K.H. Scheit 1980, Wiley- Interscience Publication, "Nucleic acid 
chemistry" Ed. L.B.Townsend, v. 1-4, Wiley- Interscience 
Publication, "Chemistry of Nucleosides and Nucleotides" Ed. 

35 L.B.Townsend, v. 1-3, Plenum Press). 

Die gesamte Lange des Linkers kann variieren. Sie entspricht 
der Anzahl der Kohl ens tof f -Atome in den Abschnitten A, C, E 
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(Fig. 7a,b,d) und liegt vorzugsweise zwischen 3 und 20. 

Optimalerweise betragt sie zwischen 4 und 10 Atomen. Die 

chemische Zusammensetzung des Linkers (Abschnitte A,C,E in Fig. 
7a,b,d) ist nicht eingeschrankt , sofern sie unter 

5 Reaktionsbedingungen stabil bleibt und keine Stoning der 
enzymatischen Reaktion verursacht. 

4.5.6 Spaltbare Verbindung, Spaltung 

10 Der Linker tragt eine spaltbare Verbindung oder spaltbare 
Gruppe (Abschnitt (B) in Fig. 7a,b,d und Abschnitt (C) in Fig. 
7k, 1). Diese spaltbare Verbindung ermoglicht die Entfernung des 
Markers und des sterischen Hindernisses am Ende jedes Zyklus. 
Ihre Wahl ist nicht eingeschrankt, sofern sie unter den Bedin- 

15 gungen der enzymatischen Sequenzierungsreaktion stabil bleibt , 
keine irreversible Storung der Polymerase verursacht und unter 
milden Bedingungen abgespalten werden kann. Unter "milden 
Bedingungen" sind solche Bedingungen zu verstehen, die den 
NSKF-Primer-Komplex nicht zerstoren, wobei z.B. der pH-Wert 

20 vorzugsweise zwischen 3 und 11 liegt, die Temperatur zwischen 
0°C und einem Temperaturwert (x) . Dieser Temperaturwert (x) 
hangt von der Tm des NSKF-Primer-Komplexes (Tm ist "melting 
Point") und wird beispielsweise als Tm (NSKF-Primer-Komplex) 
minus 5°C errechnet (z.B. Tm ist 47°C, dann liegt die maximale 

25 Temperatur bei 42°C; unter diesen Bedingungen eignen sich 
besonders Ester-, Thioester-, Disulf id-Verbindungen und 
photolabile Verbindungen als spaltbare Verbindungen) . 

Vorzugsweise geh6rt die genannte Verbindung zu chemisch oder 
30 enzymatisch spaltbaren oder photolabilen Verbindungen. Als 
Beispiele von chemisch spaltbaren Gruppen sind Ester-, 
Thioester- und Disulf id-Verbindungen bevorzugt (Fig. 7k, 1) 
(„Chemistry of protein conjugation and crosslinking" Shan S. 
Wong 1993 CRC Press Inc., Herman et al. Method in Enzymology 
35 1990 v.184 S.584, Lomant et al. J.Mol.Biol. 1976 v. 104 243, 
"Chemistry of carboxylic acid and esters" S.Patai 1969 
Interscience Publ . ) . Beispiele fur photolabile Verbindungen 
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(Fig. 7m) konnen in folgenden Literaturstellen gefunden werden: 
"Protective groups in organic synthesis" 1991 John Wiley & 
Sons, Inc., V. Pillai Synthesis 1980 S.l, V. Pillai Org. 
Photochem. 1987 v. 9 S.225, Dissertation „Neue photolabile 
5 Schutzgruppen fur die lichtgesteuerte Oligonucleotidsynthese" 
H.Giegrich, 1996, Konstanz, Dissertation „Neue photolabile 
Schutzgruppen ftir die lichtgesteuerte Oligonucleotidsynthese" 
S.M.Buhler, 1999, Konstanz).. 

10 Die Position der spaltbaren Verbindung/Gruppe im Linker ist 
vorzugsweise nicht weiter als 10 Atome von der Base entfernt, 
noch bevorzugter nicht weiter als 3 Atome. Besonders bevorzugt 
liegt die spaltbare Verbindung Oder Gruppe direkt an der Base. 

15 Der Spaltungs- und Entfernungs-Schritt ist in jedem Zyklus vor- 
handen und mufi unter milden Bedingungen (s.o.) verlaufen, so 
dass die Nukleinsauren nicht beschadigt oder modifiziert 
werden. 

20 Die Spaltung lauft bevorzugt chemisch (z.B. in milder saurer 
oder basischer Umgebung fiir eine Ester-Verbindung oder durch 
Zugabe eines Reduktionsmittel, z.B. Dithiothreitol oder 
Mercaptoethanol (Sigma) bei der Spaltung einer Disulfid- 
Verbindung) , siehe Beispiel 1, oder physikalisch (z.B. durch 

25 Beleuchtung der Oberflache mit Licht einer bestimmten 
Wellenlange fur die Spaltung einer photolabilen Gruppe, 
Dissertation „Neue photolabile Schutzgruppen fur die 
lichtgesteuerte Oligonucleotidsynthese" H. Giegrich, 1996, 
Konstanz) ab. 

30 

Nach der Spaltung verbleibt an der Base ein Linkerrest (A) 
(Fig. 7c). Falls die nach der Spaltung am Linkerrest frei 
gewordene Mercapto- Gruppe weitere Reaktionen stort, kann sie 
mit bekannten Mitteln chemisch modifiziert werden (wie z.B. 
35 durch Disulfid- oder Iodacetatverbindungen) . 

Die Synthese eines spaltbaren Linkers wird an Beispielen 
gezeigt (vgl. Beispiele 1 und 2). 



WO 02/08*382 



PCT/EP02/04659 



- 35 - 

4.5.7 Kotnbination von Polymerase und NT* 

Insgesamt spielen die GrdSe, die Ladung und die chemische 
Struktur des Markers, die Lange des spaltbaren Linkers und des 
5 Linker-Rests sowie auch die Wahl der Polymerase eine wichtige 
Rolle. Sie bestimmen gemeinsam, ob das markierte NT* durch die 
Polymerase in die wachsende Nukleinsaurekette eingebaut wird, 
und ob dadurch der Einbau des nachsten markierten NT* verhindert 
wird. Zwei Bedingungen sind dabei besonders zu berucksichtigen: 

10 

Einerseits ist es wichtig, dass die Polymerase die 
Nukleinsaurekette mit dem eingebauten modif izierten NT* nach der 
Spaltung des Linkers weiter verlangern kann. Es ist also 
wichtig, dass der Linkerrest "A" (Fig. 7c) nach der Spaltung 

15 keine wesentliche Storung fur die weitere Synthese darstellt. 
Andererseits mussen eingebaute, nicht gespaltene NTs* ein 
Hindernis darstellen. Es konnen viele fur die Reaktion 
geeignete NTs* synthetisiert werden. Im einzelnen mufi fur jede 
Kombination aus Polymerase und NTs* eine Vorversuchsreihe 

20 durchgefuhrt werden, in der die Tauglichkeit eines bestimmten 
NT*-Typs fur die Sequenzierung erprobt wird. 

Die Puf ferbedingungen werden nach Angaben des 
Polymeraseherstellers gewahlt. Die Reaktionstemperatur wird fur 
25 nicht thermos tabile Polymerasen nach Angaben des Hers tellers 
gewahlt (z.B. 37°C fur Sequenase Version 2), fur thermostabile 
Polymerasen (z.B. Taq- Polymerase) betragt die 

Reaktionstemperatur maximal den Temperaturwert (x) . Dieser 
Temperaturwert (x) hangt von der Tm des NSKF- Primer -Komplexes 

30 und wird z.B. als Tm (NSKF- Primer- Komplex) minus 5°C errechnet 
(z.B. Tm ist 47°C, dann liegt die maximale Reakt ions tempera tur 
bei 42°C) . Diese Puf ferbedingungen und Reaktionstemperatur 
werden weiter als "optimale Puffer- und Temper a turbedingungen" 
bezeichnet . 

35 

Die Reaktionszeit (entspricht der Dauer des Einbau- Schrittes in 
einem Zyklus) betragt vorzugsweise weniger als eine Stunde, 
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idealerweise liegt die Reaktionszeit zwischen 10 sec und 10 
min. 

Als Beispiele von geeigneten Kombinationen zwischen NT* und 
5 Polymerase sind folgende Kombinationen zu nennen: 

a) NT* mit einem kurzen Linkerrest (Synthese siehe Beispiel 2, 
Fig. 7e,h,i): dNTP-SS-TRITC (L7) , dNTP-SS-Cy3 (Lll) in Kombina- 
tion mit Sequenase Version 2, Kl enow- Fragment DNA- Polymerase I 

10 E.coli, Taq- Polymerase (GibcoBRL) . 

b) NT* mit einem langen Linkerrest (Synthese siehe Beispiel 1, 
Fig. 7f,g,j): dNTP-SS-TRITC (L14) in Kombination mit Sequenase 
Version 2 oder, Klenow- Fragment DNA- Polymerase I E.coli oder 
ProHATM- Polymerase (Eurogentech) . 

15 

Die Tauglichkeit eines Linkerrests an der Base (A) fur die 
Reaktion wird in einem Testsystem gepruft. Dabei werden 
gespaltene NTs* in eine Nukleinsaurekette nacheinander einbaut. 
Man verwendet z.B. dUTP* mit dem gewunschten gespaltenen 

20 Linkerrest, poly-dA als Matrize, 01 igo-dT20- Primer, die 
gewunschte Polymerase und fuhrt unter fur die jeweilige 
Polymerase geeigneten optimalen Puffer- und 

Temperaturbedingungen eine Reaktion durch. Die NT*-Konzentration 
liegt vorzugsweise zwischen 5 pmol/1 und 200 ymol/1. Nach der 

25 Reaktion wird die Anzahl der in die Nukleinsaurekette 
eingebauten NTs* analysiert, z.B. durch die Auftrennung der 
Lange nach in einem Gel. Fur die Ruckschliisse auf die 
Tauglichkeit des Linkerrests kann man folgende Angaben 
verwenden: Wenn die Polymerase mehr als 20 NTs* einbauen kann, 

30 so ist dieser Linkerrest fur eine Sequenzierungsreaktion 
geeignet. Beim Einbau von weniger als 20 gespaltenen NTs* ist 
diese Kombination aus NT* und Polymerase nicht optimal fur die 
Sequenzierungsreaktion. 

35 Wenn ein passender Linkerrest feststeht, wird in einem weiteren 
Testsystem gepruft, ob die markierten, nicht gespaltenen NTs* 
als Semiterminatoren funktionieren. Das wird gepruft, indem die 
markierten NTs* unter fur die Reaktion geeigneten optimalen 
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Puffer- und Temperaturbedingungen mit der Polymerase und einer 
Matrize in)cubiert werden. Die NT*-Konzentration liegt vorzugs- 
weise zwischen 5 pmol/1 und 200 ymol/1. Die Matrize ist so zu 
wahlen, dass der Einbau mehrerer NTs* nacheinander zu erwarten 
5 ware, z.B. fur dUTP* kann man polydA, wie im oben dargestellten 
Beispiel verwenden. Idealerweise baut die Polymerase nur ein 
einziges NT* ein. 

Falls bei gegebenen optimalen Puffer- und Temperaturbedingungen 
10 durch eine Polymerase mehrere NTs* nacheinander eingebaut 
werden, kann man die Reaktionsparameter (z.B. NT* -Konzent ration, 
Reaktionstemperatur) verandern und der jeweiligen Kombination 
aus Polymerase und NT* anpassen. Das wichtigste dabei ist, dass 
die Polymerase in der vorgegebenen Zeit (liegt vorzugsweise 
15 zwischen 10 sec und 10 min) ein zweites NT* nicht einbaut. 

Erf indungsgemafc erfolgt diese Anpassung in einer 
Aus fuhrungs form durch die Veranderung der Reaktionstemperatur. 
Die anderen Parameter der Reaktion werden dabei konstant 
20 gehalten. 

Die NT* -Konzent rat ion liegt bei diesen Experimenten ublicherwei- 
se zwischen 5 ymol/1 und 200 pmol/1, vorzugsweise zwischen 10 
ymol/1 und 100 ymol/1. Die Konzentration der Polymerase und die 

25 Puf ferbedingungen werden nach Angaben vom Hers teller gewahlt. 
Die Dauer der Reaktion kann variieren und liegt vorzugsweise 
zwischen 10 sec und 10 min, was der Dauer des Einbau- Schrittes 
(a) in einem Zyklus entsprechen wurde. Bei nicht thermostabilen 
Polymerasen wie z.B. Sequenase Version 2 (Amersham Pharmacia 

30 Biotech) , exonuclease free Klenow- Fragment der DNA Polymerase I 
(Amersham Pharmacia Biotech) wird die Reaktionsthemperatur von 

konventionellen 37°C vorzugsweise auf 20°C bis 30°C reduziert. 
Bei thermostabilen Polymerasen wie z.B. Taq- Polymerase (Gib- 
coBRL) , ProHATM- Polymerase (Eurogentech) wird die Reaktion- 

35 stemperatur von konventionellen 70-75°C vorzugsweise auf Werte 
reduziert, die zwischen 30°C und dem Temperaturwert (x) liegen. 
Dieser Temperaturwert (x) hSngt von der Tm des NSKF-Primer- 
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Komplexes und wird als Tm (NSKF-Primer-Komplex) minus 5°C 
errechnet (z.B. Tm ist 47°C, dann liegt der Temperaturwert (x) 
bei 42°C) . 

5 In einer anderen bevorzugten Ausfuhrungsform der Erfindung er- 
folgt die Anpassung der Reaktionsbedingungen durch die 
Verminderung der NT* -Konzentration auf unter 5 ymol/1, die 
anderen Parameter der Reaktion (Puf ferbedingungen, 
Temperaturbedingungen) werden konstant gehalten. Die 

10 Konzentration der NT* liegt vorzugsweise bei dieser Anpassung 
zwischen 0.5 pmol/1 und 5 jimol/1. Die Dauer der Reaktion liegt 
zwischen 10 sec und 10 min. Das wichtigste bei der Wahl der NT*- 
Konzentration ist, dass die Polymerase in der vorgegebenen Zeit 
(liegt vorzugsweise zwischen 10 sec und 10 min) ein zweites NT* 

15 nicht einbaut. 

Nach Optimierung der Reaktionsbedingungen fur den Einbau eines 
einzelnen NT* muS man die Reaktion mit gespaltenen NTs* wieder- 
holen. Unter entsprechend geanderten Reaktionsparameter muS 
20 Polymerase die gespaltenen NTs* nacheinander einbauen konnen. 

Die Optimierungsreaktion korreliert mit dem Einbauschritt , 
Schritt (b) , in einem Zyklus . Die fur die Optimierungsreaktion 
ermittelten Bedingungen, die Temperatur, die Konzentration an 
25 NT*, die Puf ferbedingungen, die Dauer der Reaktion werden fur 
die Reaktion auf der Oberflache ubernonunen. 

Unter diesen Reaktionsbedingungen erfolgt der Einbau von NT* in 
die NSKF-Primer-Komplexe vorzugsweise so, dass an mehr als 50% 

30 der an der Sequenzierungsreaktion beteiligten NSKF-Primer- 
Komplexen in einem Zyklus ein markiertes NT* eingebaut wird, 
vorzugsweise an mehr als 90%. Das hangt damit zusammen, dass an 
manchen Nukleinsaureketten die Reaktion sehr langsam ablauft. 
Ein Einbau der NTs* an jeder komplementaren Position in jedem 

35 Zyklus wird angestrebt, ist aber nicht erforderlich, weil nur 
die erfolgreichen Einbaureaktionen detektiert und ausgewertet 
werden; eine verzdgerte Reation im Nachfolgenden Zyklus fuhrt 
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nicht zu einem Sequenzierungsfehler . 

Vorzugsweise wird f\ir alle NTs* dieselbe Polymerase verwendet. 
Es kdnnen aber auch verschiedene Polymerasen fiir verschiedene 
5 NTs* eingesetzt werden. 

4.5.8 Farbiges Kodierungsschema, Anzahl der Farbstoffe 

Einen Zyklus kann man durchfuhren mit : 

10 

a) vier verschieden markierten NT*s 

b) zwei verschieden markierten NT*s 

c) einem markierten NT* 

d) zwei verschieden markierten NT*s und zwei unmarkierten 
15 NTs, 



d.h. 



a) Man kann alle 4 NTs mit verschiedenen Farbstoffen 
20 markieren und alle 4 gleichzeitig in die Reaktion einsetzten. 

Dabei erreicht man die Sequenzierung einer Nukleinsaurekette 
mit einer minimalen Anzahl von Zyklen. Diese Variante der 
Erfindung stellt allerdings hohe Anforderungen an das 
Detektionssystem: 4 verschiedene Farbstoffe mussen in jedem 
25 Zyklus identif iziert werden. 

b) Zur Vereinfachung der Detektion kann eine Markierung mit 
zwei Farbstoffen gewShlt werden. Dabei werden 2 Paare von NTs* 
gebildet, die jeweils verschieden markiert sind, z.B. A und G 

30 tragen die Markierung "X", C und U tragen die Markierung "Y» . 
In die Reaktion in einem Zyklus (n) werden 2 unterschiedlich 
markierte NTs* gleichzeitig eingesetzt, z.B. C* in Kombination 
mit A*, und im darauf f olgenden Zyklus (n+1) werden dann U* und G* 
zugegeben. 

35 

c) Man kann auch nur einen einzigen Farbstoff zur 
Markierung aller 4 NTs* verwenden und pro Zyklus nur ein NT* 
einsetzen. 
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d) In einer technisch vereinfachten Ausfuhrungsform werden 
pro Zyklus zwei unterschiedlich markierte NT's eingesetzt und 
zwei unmarkierte NTs (sogen. 2NT*s / 2NTs-Methode) . Diese 
5 Ausfuhrungsform kann verwendet werden, urn Varianten (z.B. Muta- 
tionen, Oder alternativ gespleiSte Gene) einer bereits 
bekannten Sequenz zu ermitteln. 

4.6 Detektionsapparatur 

10 

Einzelne Molekiile auf einer Oberf lache kann man mit verschiede- 
nen Methoden untersuchen. Es sind mehrere Verfahren bekannt: 
z.B. AtomForce-Mikroscopie, Elektronen-Mikroskopie , Nahfeld- 
Fluoreszenz-Mikroscopie, Weitfeld-Fluoreszenz-Mikroskopie, TIR- 
15 Mikroskopie usw. (Science 1999 v. 283 1667, Unger et al. BioTech- 
niques 1999 v. 27 S.1008, Ishijaima et al. Cell 1998 v. 92 S.161, 
Dickson et al. Science 1996 v. 274 S.966, Xie et al. Science 
1994 v.265 S.361, Nie et al. Science 1994 v. 266 S.1018, Betzig 
et al. Science 1993 v. 262 S.1422) . 

20 

ErfindungsgemaS werden Fluoreszenz-Signale einzelner in die 
Nukleinsaurekette eingebauter NTs* vorzugsweise mit einem 
Weitfeld-Fluoreszenz-Mikroskop (Epif luoreszenz) oder einem 
Laser-Scanning-Mikroskop (Epif luoreszenz) Oder einem TIRF- 
25 Microskop (Total Internal Reflection Fluorescence Microscope) . 

Es sind verschiedene Varianten der Konstruktion einer solchen 
Apparatur mSglich (Weston et al. J.Chem.Phys. 1998 v. 109 
S.7474, Trabesinger et al. Anal. Chem. 1999 v. 71 S.279, Adachi 

30 et al. Journal of Microscopy 1999 v. 195 S.125, Unger et al. 
BioTechniques 1999 v. 27 S.1008, Ishijaima et al. Cell 1998 v. 92 
S.161, Dickson et al. Science 1996 v. 274 S.966, Tokunaga et al. 
Bichem.Biophys.Res.com. 1997 v. 235 S.47, "Confocal Laser 
Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific 

35 Publishers, "New Techniques of optical microscopy and 
microspectroscopy" 1991 Ed. R.Cherry CRC Press, Inc., 
"Fluorescence microscopy" 1998 2.ed. Herman BIOS Scientific 
Publishers, "Handbook of biological confocal microscopy" 1995 
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J.Pawley Plenum Press ). Unterschiede in ihrem konkreten Aufbau 
ergeben sich aus der Variation ihrer Einzelteile. Die Vorrich- 
tung far das Anregungslicht kann z.B. auf der Basis eines La- 
sers, einer Lampe oder von Dioden funktionieren. Fur die Detek- 
5 tionsvorrichtung konnen sowohl CCD-Kameras als auch PMT dienen. 
Andere Beispiele fur technische Details siehe ("Confocal Laser 
Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific 
Publishers, "New Techniques of optical microscopy and 
microspectroscopy" 1991 Ed, R.Cherry CRC Press, Inc., "Fluores- 

10 cence microscopy" 1998 2.ed. Herman BIOS Scientific Publishers, 
"Handbook of biological confocal microscopy" 1995 J.Pawley 
Plenum Press) . Es ist nicht die Aufgabe dieser Erf indung, alle 
moglichen technischen Varianten einer Detektionsvorrichtung 
aufzuzahlen. Der prinzipielle Aufbau einer geeigneten Apparatur 

15 wird in einem Schema Fig. 8 erlautert. Sie besteht aus 
folgenden Elementen: 

Lichtquelle zur Anregung der Fluoreszenz (1) 
Lichtlei tender Teil (2) 
20 Scant isch (3) 

Vorrichtung zur Selektion von Spektren (4) 
Detektionsvorrichtung (5) 

Computer mit Steuerungs- und Analysefunktionen (6) 

25 Diese Elemente der Apparatur konnen kommerziell erworben werden 
(Mikroskop-Firmen: Zeiss, Leica, Nikon. Olympus) . 

Im folgenden soli beispielsweise eine fur die Detektion 
einzelner Molekiile geeignete Kombination aus diesen Elementen 
30 vorgestellt werden: 

Weitfeld-Fluoreszenz-Mikroskop Axioplan 2 (Zeiss) mit Quecksil- 
berdampf lampe 

Objektiv Planneofluar lOOx, NA 1.4 (Zeiss) 
35 Kamera Photometrix oder AxioCam (Zeiss) 

Computer mit Software zur Steuerung und Analyse 
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Nachfolgend soil die Vorgehensweise bei der Detektion erl&utert 
werden. Man beachte dabei die allgemeinen Regeln der Fluo- 
reszezmikroskopie ("Confocal Laser Scanning Microscopy" 1997 
Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of 
5 optical microscopy and microspectroscopy" 1991 Ed. R.Cherry CRC 
Press, Inc. # "Fluorescence microscopy" 1998 2.ed. Herman BIOS 
Scientific Publishers, "Handbook of biological confocal 
microscopy" 1995 J.Pawley Plenum Press) . 



10 Die Detektion umfaSt folgende Phasen: 

1) Vorbereitung zur Detektion 

2) Durchfuhrung eines Detektionsschrittes in jedem Zyklus, 
wobei jeder Detektionsschritt als Scanvorgang ablauft und 

15 folgende Qperationen umfa&t: 

a) Einstellung der Position des Objektivs (X,Y-Achse), 

b) Einstellung der Fokusebene (Z-Achse) , 

c) Detektion der Signale einzelner Molekule, Zuordnung 
des Signals zu NT* und Zuordnung des Signals zum 

20 jeweiligen NSKF, 

d) Verschiebung zur nachsten Position auf der Oberflache. 

Die Signale von in die NSKFs eingebauten NTs* werden durch das 
Abscannen der Oberflache registriert. Der Scanvorgang kann in 

25 verschiedener Weise ausgefuhrt werden ("Confocal Laser Scanning 
Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New 
Techniques of optical microscopy and microspectroscopy" 1991 
Ed. R.Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 
2.ed. Herman BIOS Scientific Publishers, "Handbook of 

30 biological confocal microscopy" 1995 J.Pawley Plenum Press). 
Beispielsweise wird ein diskontinuierlicher Scanvorgang 
gewahlt. Dabei wird das Objektiv schrittweise uber die 
Oberflache bewegt (Fig. 8a), so dass von jeder 
Oberf lachenposition ein zweidimensionales Bild (2D-Bild) 

35 entsteht (Fig 8b, c), fur Versuchsanordnung s. Beispiel 6. 



Dieses 2D-Bild kann mit verschiedenen Methoden erstellt werden: 
z.B. durch den Laser-Scan einer Position des Mikroskopf eldes 
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(Laser-Scanning-Microskopie) oder durch eine Kameraaufnahme an 
einer Position (vgl. Handbucher der Mikroskopie) . Als Beispiel 
wird die Detektion einzelner Molekule mit einer CCD-Kamera 
beschrieben. 



Die Detektion wird schematisch am Beispiel der Sequenzierung 
eines 1Mb langen DNA-Stucks erlautert: 

10 1) Vorbereitung zur Detektion: * 
Am Anfang wird festgelegt, wie viele NSKF-Sequenzen zur 
Rekonstruktion der ursprunglichen Sequenz analysiert werden 
imissen. Im Fall einer Rekonstruktion nach dem SchrotschuS- 
Verfahren ("Automated DNA sequencing and analysis" S. 231 ff. 

15 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 
1999 v.9 S.868, Huang Genomics 1996 v. 33 S.21, Bonfield et al. 
NAR 1995 v.23 S.4992, Miller et al. J . Comput . Biol . 1994 v.l 
S.257) spielen folgende Faktoren eine Rolle: 1) Von jedem NSKF 
wird bei der Sequenzierung eine Sequenz von ca. 300-500 NTs 

20 bestimmt. 2) Die Gesamtlange der zu analysierenden Sequenz ist 
wichtig. 3) Bei der Sequenzierung muS ein bestimmtes MaS an 
Redundanz erreicht werden, urn die Genauigkeit zu steigern und 
eventuelle Fehler zu korrigieren. Insgesamt ist zur 
Rekonstruktion des grofiten Teils der ursprunglichen Sequenz die 

25 etwa 10- bis 100 -f ache Menge an Rohsequenzen erforderlich, d.h. 
bei diesem Beispiel mit einer Mb, werden 10 bis 100 Mb 
Rohsequenzdaten gebraucht. Bei einer durchschnittlichen 
Sequenzlange von 400 bp pro NSKF benotigt man entsprechend 
25.000 bis 250.000 DNA- Fragment e . 

30 

2) Durchfuhrung eines Detektionsschrittes in jedem Zyklus 
Zur Sequenzierung miissen die Positionen der NSKFs bestimmt wer- 
den, damit man eine Grundlage fur die Zuordnung der Signale 
hat. Die Kenntnis dieser Positionen erlaubt eine Aussage 
35 daruber, ob die Signale einzelner Molekule von eingebauten NTs* 
stammen oder von zuf Sllig an die Oberf lache gebundenen NTs* . 
Diese Positionen konnen mit verschiedenen Methoden 
identif iziert werden. 
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In einer bevorzugten Ausfuhrungsform werden die Positionen 
gebundener NSKF-Primer-Komplexe wahrend der Sequenzierung 
identifiziert. Dabei wird die Tatsache genutzt, dass die 
5 Signale von den in die Nukleinsaurekette eingebauten NTs* immer 
dieselben Koordinaten haben. Das ist durch die Fixierung der 
Nukleinsaureketten gewShrleistet. Die unspezifisch gebundenen 
NTs* binden zuf&llig an verschieden Stellen der Oberfiache. 

10 Zur Identif izierung der Positionen von fixierten NSKFs werden 
die Signale auf Obereinstiramung ihrer Koordinaten aus mehreren 
aufeinander folgenden Zyklen iiberpruft. Das kann z.B. am Anfang 
der Sequenzierung erfplgen. Die ubereinstimmende Koordinaten 
werden als Koordinaten der DNA-Fragmente bewertet und gespei- 

15 chert. 

Das Scan- System mu£ reproduzierbar fiber mehrere Zyklen die 
Oberflache abscannen konnen. X,Y und Z-Achsen-Einstellungen an 
jeder Oberf lachenposition k6nnen von einem Computer 
20 kontrolliert werden. Stabilitat und Reproduzierbarkeit der 
Einstellung von Objektivpositionen in jedem Scanvorgang 
entscheiden uber die Qualitat der Detektion und somit viber die 
Identif izierung der Signale einzelner Molekule. 

25 a) Einstellung der Position des Objektivs (X,Y-Achse) 

Die mechanische Instabilitat der kommerziell erhaltlichen Scan- 
tische und die geringe Reproduzierbarkeit der wiederholten Ein- 
stellung derselben X, Y-Positionen machen eine prazise Analysen 

30 der Signale einzelner Molekule uber mehrere Zyklen schwierig. 
Es existieren viele M6glichkeiten, eine Ubereinstimmung der 
Koordinaten bei wiederholten Einstellungen zu verbessern bzw. 
mogliche Abweichungen zu kontrollieren. Als Beispiel wird eine 
Kontrollmoglichkeit angefiihrt. Nach einer groben mechanischen 

35 Einstellung der Objektivposition wird ein Kontrollbild von 
einem mit der Oberflache fest verbundenen Muster gemacht. Auch 
wenn die mechanische Einstellung nicht exakt dieselben 
Koordinaten aufweist (Abweichungen bis zu 10 pm sind durchaus 
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moglich) , kann man mittels optischer Kontrolle eine Korrektur 
vornehmen. Das Kontrollbild vom Muster dient als 
Koordinatensystem fur das Bild mit Signalen von eingebauten 
NTs* . Eine Voraussetzung ftir eine solche Korrektur ist, dass 
5 keine weiteren Bewegungen der Oberflache zwischen diesen beiden 
Aufnahmen gemacht werden. Signale von einzelnen Molekiilen 
werden in Relation zum Muster gesetzt, so dass eine X,Y- 
Abweichung in der Musterposition gleiche X, Y-Abweichung in der 
Position der Signale einzelner Molekule bedeutet. Das 
10 Kontrollbild vom Muster kann vor, wahrend oder nach der 
Detektion einzelner Molekule gemacht werden. Ein solches Kon- 
trollbild muB entsprechend bei jeder Einstellung auf einer 
neuen Oberf lachenpos it ion gemacht werden. 

15 b) Einstellung der Fokusebene (Z-Achse) 

Die Oberflache ist nicht absolut plan und weist verschiedene 
Unebenheiten auf. Dadurch verandert sich der Oberf lache-Objek- 
tiv-Abstand beim abscannen benachbarter Stellen. Diese Unter- 
20 schiede im Abstand konnen dazu fuhren, dass einzelne Molekule 
die Fokusebene verlassen und so der Detektion entgehen. 

Aus diesem Grund ist es wichtig, dass beim Abscannen der Ober- 
flache eine reproduzierbare Einstellung der Fokusebene am jeder 
25 Objektivposition erreicht wird. 

Es gibt verschiedene Moglichkeiten, die Fokusebene reproduzier- 
bar einzustellen. Beispielsweise kann folgende Methode 
angewendet werden: Da die Anregung einzelner Molekule zum 

30 Ausloschen ihrer Fluoreszenz fuhren kann, wird auf die 
Oberflache ein Marker aufgebracht, der zur Einstellung der 
Fokusebene dient. Danach erfolgt die Detektion der Signale 
einzelner Molekule, Der Marker kann beliebiger Natur sein (z.B. 
Farbstof f oder Muster) , darf aber die Detektion und die 

35 Reaktion nicht beeintrachtigen. 

c) Detektion der Signale einzelner Molekule, Zuordnung des 
Signals zu NT* und Zuordnung des Signals zum jeweiligen NSKF. 
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Das mit Hilfe des Detekt ions systems erzeugte zweidimensionale 
Bild der Reaktionsoberf lache entMlt die Signalinformationen 
von in die NSKFs eingebauten NT*s. Diese mussen vor der weiteren 
5 Verarbeitung aus der Gesamtdatenmenge der Bildinformationen mit 
geeigneten Methoden extrahiert werden. Die dazu notwendigen 
Algorithmen zur Skalierung, Transformation und Filterung der 
Bildinformationen zahlen zum Standardrepertoir der digitalen 
Bildverarbeitung und Mustererkennung (Haberacker P. "Praxis der 

10 Digitalen Bildverarbeitung und Mustererkennung" . Hanser-Verlag, 
Munchen, Wien, 1995; Galbiati L.J. "Machine vision and digital 
image processing fundamentals". Prentice Hall, Englewood 
Cliffs, New Jersey, 1990) . Die Signalextraktion erfolgt 
vorzugsweise uber ein Grauwertbild, das die 

15 Helligkeitsverteilung der Reaktionsoberf lache fiir den 
jeweiligen Fluoreszenzkanal abbildet. Wenn bei der 
Sequenzierungsreaktion mehrere Nukleotide mit unterschiedlichen 
Fluoreszenz-Farbstof fen verwendet werden, kann zunachst fur 
jedes verwendete f luoreszenzmarkierte Nukleotid (A,T,C,G Oder 

20 U) ein separates Grauwert-Bild erzeugt werden. Dafur konnen 
prinzipiell 2 Verfahren angewendet werden: 

1. Durch Verwendung von geeigneten Filtern (Zeiss-Filtersatze) 
wird fur jeden Fluoreszenzkanal ein Grauwertbild erzeugt. 

25 

2. Aus einem aufgenommenen Mehrkanal-Farb-Bild werden mit Hilfe 
eines geeigneten Algorithmus durch ein 
Bildverarbeitungsprogramm die relevanten Farbkanale extrahiert 
und jeweils als Grauwertbild einzeln weiterverarbeitet . Zur 

30 Kanalextraktion wird dabei ein fur den jeweiligen Kanal 
spezifischer Farb-Schwellwertalgorithmus eingesetzt. So 
entstehen zunachst aus einem Mehrkanal-Farbbild einzelne 
Grauwertbilder 1 bis N. Diese Bilder definieren sich wie folgt: 

35 GB^ (s(x,y)) einkanaliges Grauwertbild 

N={l, . . . , Anzahl der Fluoreszenzkauiale} . 
M= { 0 , 1 , . . . , 255 } Grauwertmenge 
S=(s(x,y)) Bildmatrix des Grauwertbildes 
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y=o,i, 
(x,y) 

s(x,y)e M 



x=0,l 



/ • • • t 



R-l 



L-l 



Bildzeilen 
Bildspalten 

Ortskoordinaten eines Bildpunktes 
Grauwert des Bildpunktes. 



Aus dieser Datenmenge wird nun durch ein geeignetes Programm 
die relevante Bildinformation extrahiert. Ein solches Programm 
sollte folgende Arbeitsschritte realisieren: 

10 Pur GBi bis GB^ durchfuhren: 

I. Vorverarbeitung des Bildes, so zum Beispiel gegebenenfalls 
Reduktion des durch die Digital isierung der Bildinformation 
entstandenen Bildrauschens, etwa durch Grauwertglattung . 



II. Prufung jedes Bildpunkt (x,y) des Grauwertbildes, ob dieser 
Punkt im Zusammenhang mit den ihn umgebenden unmittelbaren und 
weiter entfernten Nachbarbildpunkten die Eigenschaf ten eines 
Fluoreszenzpunktes erfullt. Diese Eigenschaf ten hangen unter 

20 anderem von der verwendeten Detektionsapparatur und der 
Auflosung des Grauwertbildes ab. Sie konnen beispielsweise ein 
typisches Verteilungsmuster von Helligkeits-Intensitatswerten 
uber einer den Bildpunkt umgebenden Matrix darstellen. Die dazu 
verwendbaren Methoden der Bildsegmentierung reichen von 

25 einfachen Schwellwertverfahren bis hin zur Verwendung 
neuronaler Netze, 

Erfullt ein Bildpunkt (x,y) diese Anforderungen, dann folgt ein 
Vergleich mit den Koordinaten von in bisher durchgefuhrten 

30 Sequenzierungszyklen identif izierten NSKFs. Bei einer Uber- 
einstimmung erfolgt die Zuordnung des Signals mit dem aus dem 
jeweiligen Fluoreszenzkanal hervorgehenden Nukleotid zu diesem 
NSKF. Signale mit nicht ubereinstimmenden Koordinaten werden 
als Hintergrundsignale bewertet und verworfen. Die Analyse der 

35 Signale kann parallel zum Scanvorgang erfolgen. 



15 



In einer beispielhaf ten Ausfuhrung wurde ein 8-Bit-Grauwertbild 
mit einer Aufl6sung von 1317 x 1035 Pixel verwendet. Urn die 
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durch die Digitalisierung entstandenen Veranderungen am Bild zu 
reduzieren, erfolgte zunachst eine Vorverarbeitung des Gesamt- 
bildes: Jedem Bildpunkt wurde der Mittelwert der Helligkeiten 
seiner 8-Nachbani zugewiesen. Bei der gew&hlten Aufldsung 
5 entsteht dadurch ein fur einen Fluoreszenzpunkt typisches 
Muster eines zentralen Bildpunkt mit dem grofiten 
Helligkeitswert und Nachbarbildpunkten mit nach alien Seiten 
hin abfallenden Helligkeiten. Erfullte ein Bildpunkt diese 
Kritierien und Uberschritt der zentrifugale Helligkeitsabf all 
10 einen bestimmten Schwellenwert (zur Exklusion zu schwacher 
Fluoreszenzpunkte) , dann wurde dieser zentrale Bildpunkt als 
Koordinate eines- Fluoreszenzpunkt es gewertet. 

d) Verschiebung des Objektivs zur n&chsten Position auf der 
15 Oberflache. Nach der Detektion der Signale einzelner Molekule 
wird das Objektiv uber einer anderen Position der Oberflache 
positioniert . 

Insgesamt kann beispielsweise eine Folge von Aufnahmen mit der 
20 Kontrolle der X, Y-Position, der Einstellung der Fokusebene und 
mit der Detektion einzelner Molekule bei jeder neuen Objek- 
tivposition gemacht werden. Diese Schritte konnen durch einen 
Computer gesteuert werden. 

25 4.7 Zeitlicher Ablauf der Verfahrensschritte 

Der Scanvorgang sowie die biochemische Reaktion nehmen eine 
gewisse Zeit in Anspruch. Wenn man diese Vorgange nacheinander 
schaltet, kann man eine optimale Leistung der Apparatur errei- 
30 chen. In einer bevorzugten Ausfuhrung wird die Reaktion auf 
zwei getrennten Oberf l&chen durchgefiihrt (Fig. 9) . 

Als Beispiel kann eine Oberflache mit gebundenen NSKF- Primer - 
Komplexen in 2 ra\amlich isolierte Teile getrennt werden, so 
35 dass Reaktionen auf diesen beiden Teilen unabhangig voneinander 
ablauf en konnen. In einem anderen Beispiel kdnnen NSKFs auch 
von vornherein auf 2 getrennten Oberfl&chen immobilisiert 
werden. 
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Danach wird die Reaktion gestartet. Das Prinzip dabei ist, dass 
wahrend auf einem Teil der Oberflache die Reaktions- und Wasch- 
schritte ablauf en, der zweite Teil abgescannt wird. Dadurch 
5 kann man einen kontinuierlichen Ablauf der Analyse erreichen 
und die Geschwindigkeit der Sequenzierung steigern. 

Die Anzahl der Oberflachen, auf denen die Reaktion ablauf t, 
kann auch grSfier als 2 sein. Das erscheint dann sinnvoll, wenn 

10 die Reaktion als zeitlich limitierender Schritt auftritt, d.h. 
die Detektion der Signale auf der Oberflache schneller als die 
Reaktions- und Waschschritte ablauf t. Urn die Gesamtdauer der 
Reaktion an die Detektionsdauer anzupassen, kann jeder einzelne 
Schritt der Reaktion auf einer einzelnen Oberflache mit einer 

15 zeitlichen Verzogerung im Vergleich zur nachsten Oberflache 
ablauf en. 

Die Erfindung wird nachfolgend anhand von Beispielen verdeut- 
licht. 

20 

Beispiele 

Beispiel 1; 

25 

Modif iziertes dUTP mit einem langen spaltbaren Linker (Fig. 7f- 
1) Als Ausgangssubstanzen dienen 5- (3-Aminoallyl) -2 1 - 
deoxyuridin- 5 1 -triphosphate AA-dUTP, (Sigma) , S^'-Dithio- 
bis (propionsaure- N-Nydroxysuccinimidester) , DTBP-NHS, (Sigma) , 

30 2-Mercaptoethylamin, MEA # (Sigma) • Zu 100 \xl 50mmol/l L6s\ang 
von AA-dUTP in 100mmol/l Borat-Puffer pH 8.5 werden 3 Aquiva- 
lente an DTBP-NHS in DMF (25 \il 0.4mol/l L6sung) zugegeben. Das 
Reaktionsgemisch wird 4 Stunden bei RT. inkubiert. AnschlieSend 
wird konz. Ammoniumacetat-Losung (pH 9) zugegeben bis die 

35 Gesamtkonzentration an CH 3 COONH 4 in der Reaktionslosung 
100mmol/l ist r und die Reaktion wird eine weitere Stunde 
inkubiert. Danach werden zu diesem Gemisch 200 \xl lmol/1 MEA- 
Losung, pH 9, zugegeben und eine Stunde bei RT inkubiert. 
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AnschlieSend wird zu diesem Gemisch solange eine ges&tigte 
Losung an I 2 in 0 -3mol/l KI-Losung zugetropft, bis die Iodfarbe 
bestehen bleibt. Die modif izierten Nukleotide werden auf einer 
DEAE-Cellulose-Saule in Anunoniumcarbonat- Gradient (pH 8.5) von 
5 anderen Reaktionsprodukten abgetrennt. Isolierung des 
Nukleotids mit dem spaltbaren Linker erfolgt auf RP-HPLC. An 
diesen Linker konnen nun Farbstoffe mit verschiedenen Methoden 
gekoppelt werden ("Handbook of Fluorescent Probes und Research 
Chemicals" 6th ed. 1996, R.Haugland, Molecular Probes, Waggoner 
10 Method in Enzymology 1995 v. 246, S.362, Jameson et al. Method 
in Enzymology 1997, v. 278, S.363) . 

Auch andere Nukleotidanaloga (z.B. nach Hobbs et al. US Patent 
5,047,519, Khan et al. US Patent 5,821,356) k6nnen in die 
15 Reaktion eingesetzt werden, so dass Nukleotidanaloga mit 
Strukturen in Fig. 7f-2,3,4 und 7 g-1,2 erzeugt werden konnen. 

Als Beispiel der Ankopplung eines Farbstof fs an den Linker wird 
die Ankopplung von TRITC (Tetramethylrhodamin-isothiocyanat) 
20 angegeben (NT*-Struktur Fig. 7j) 

Das mit dem spaltbaren Linker modifizierte dNTP (300 nmol) wird 
in 30 ]il 100mmol/l Natrium-Borat-Puf fer pH 9 aufgelost 
(10mmol/l NT*) . Dazu werden 10 ^1 10mmol/l TRITC in 
25 Dimethylformamid (DMF) gegeben und 4h bei RT inkubiert. Die 
Reinigung des mit dem Farbstoff modif izierten NT* erfolgt uber 
RP-HPLC in einem Methanol -Wasser Gradienten. 

Das so hergestellte NT* erfttllt die Anforderungen des Einbaus 
30 in den DNA-Strang, des Fluoreszenznachweises und 
Kettenabbruchs nach dem Einbau und der Aufhebung der Hemmung, 
die fur das Gelingen des erf indungsgemaSen Verfahrens 
notwendig sind. 

35 Beispiel der Spaltung der Disulf idverbindung im modif izierten 
NT* , Die Spaltung erfolgt durch Zugabe von 20 bis 50mmol/l 
Dithiothreitol- Losung (DTT) oder Mercaptoethanol- Losung 
(Sigma), pH 8, auf die Reaktionsoberf lache . Die Oberflache wird 
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10 min. mit dieser Losung inkubiert, danach wird die Losung 
entfernt und die Oberflache mit einer Puf ferldsung zur 
Entfernung von DTT- bzw. Mercaptoethanol-Resten gewaschen. 

5 

Modif iziertes dUTP (dUTP-SS-CH 2 CH 2 NH 2 ) mit einem kurzen 
spaltbaren Linker (Fig. 7e-l) ♦ Als Ausgangssubstanzen dienen: 
10 Bis-dUTP, synthetisiert nach Hanna (Method in Enzymology 1989, 
v. 180, S.383), 2-Mercaptoethylamin (MEA) (Sigma). 

Zu 400 ]il 100mmol/l Bis-dUTP in 40mmol/l Boratpuffer pH 8.5 
werden IOOjjI 100mmol/l MEA- Losung pH 8.5 in H 2 0 zugegeben vmd 1 

15 Stunde bei RT inkubiert. AnschlieSend wird zu diesem Gemisch 
solange eine gesatigte Losung an I 2 in 0.3mol/l KI-L6sung zuge- 
tropft, bis die Iodfarbe bestehen bleibt. Die Nukleotide (Bis- 
dUTP \and dUTP-SS-CH 2 CH 2 NH 2 ) konnen z.B. durch eine Ethanol- 
Prazipitation oder auf einer DEAE-Cellulose-Saule im 

20 Ammoniumcarbonat-Gradienten (pH 8.5) von anderen 
Reaktionsprodukten abgetrennt werden. Bis-dUTP stort bei der 
anschlieSenden Ankopplung eines Farbstoffs an die Aminogruppe 
des Linkers nicht, so dass die Abtrennung des dUTP-SS-CH 2 CH2NH 2 
von bis-dUTP im Endreinigungsschritt erfolgen kann. 

25 

In einer ahnlichen Weise kann auch dCTP (Fig.7-e2) modif iziert 
werden, dabei dient Bis-dCTP als Ausgangssubstanz 
(synthetisiert nach Hanna et al. Nucleic Acid Research 1993, 
v.21, S.2073) . 

30 

An den Linker kdnnen nun Farbstoffe mit verschiedenen Methoden 
gekoppelt werden ("Handbook of Fluorescent Probes und Research 
Chemicals" 6th ed. 1996, R.Haugland, Molecular Probes, Waggoner 
Method in Enzymology 1995 v. 246, S.362, Jameson et al. Method 
35 in Enzymology 1997, v. 278, S.363). 

Als Beispiel der Ankopplung eines Farbstoffs an den Linker wird 
die Ankopplung des FluoroLinkTM Cy3 monofunktional dye 
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(Amersham Pharmacia biotech) (NT*-Struktur Fig. 7i) angegeben. 
Das ist ein monofunktionaler NHS-Ester-Fluoreszenzfarbstof f . 
Die Reaktion wird nach Angaben des Herstellers durchgef Ohrt : 
Das mit dem spaltbaren Linker modif izierte dNTP (300 nmol) wird 
5 in 300 pi 100mmol/l Natrium-Borat-Puf fer pH 8.5 aufgelost. Dazu 
wird Farbstoff (300nmol) gegeben und lh bei RT inkubiert. Die 
Reinigung des mit dem Farbstoff modif izierten NT* erfolgt uber 
RP-HPLC in einem Methanol -Wasser Gradienten. 

10 Ein weiteres Beispiel der Ankopplung eines Farbstoffs an den 
Linker wird die Ankopplung von TRITC (Tetramethylrhodamin-5- 
isothiocyanat, Molecular Probes) angegeben (dUTP-SS -TRITC 
Fig.7h) . 

Das mit dem spaltbaren Linker modif izierte dNTP (300 nmol) wird 
15 in 30 pi 100mmol/l Natrium-Borat-Puf fer pH 9 aufgel6st (10mmol/l 
NT*) . Dazu werden 10 pi 10mmol/l TRITC in DMF gegeben und 4h bei 
RT inkubiert. Die Reinigung des mit dem Farbstoff modif izierten 
NT* erfolgt fiber RP-HPLC in einem Methanol -Wasser Gradienten. 

20 Das so hergestellte NT* erfullt die Anf orderungen des Einbaus 
in den DNA-Strang, des Fluoreszenznachweises und 
Kettenabbruchs nach dem Einbau und der Aufhebung der Hemmung, 
die fur das Gelingen des erf indungsgemaSen Verfahrens 
notwendig sind. 

25 

Beispiel der Spaltung der Disulf idverbindung im modif izierten 
NT*. Die Spaltung erfolgt durch Zugabe von 20 bis 50mmol/l 
Dithiothreitol-L6sung (DTT) oder Mercaptoethanol- Losung 
(Sigma), pH 8, auf die Reaktionsoberf lache. Die Oberflache 
30 wird 10 min. mit dieser Losung inkubiert, danach wird die 
Losung entfernt und die Oberflache mit einer Pufferlosung zur 
Entfernung von DTT- bzw. Mercaptoethanol -Res ten gewaschen. 

Weitere NT*s, wie z.B. in Fig. 7k, 71 # 7m dargestellt, konnen 
35 ahnlich zu den in Beispielen 1 und 2 beschriebenen NT-Analoga 
synthetisiert \and im Verfahren eingesetzt werden. Fur die 
einzelnen Synthesenschritte siehe beispielsweise J.L.Ruth et 
al. Molecular Pharmacology 1981 v. 20 S.415, L. 6tv6s et al. NAR 
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1987 v. 15 S.1763, G.E.Wright et al. Pharmac Ther. 1990 v. 47, 
S.447, ^Nucleotide Analogs; Synthesis and Biological Function" 
K.H. Scheit 1980, Wiley- Inter science Publication, "Nucleic acid 
chemistry" Ed. L.B.Townsend, v. 1-4, Wiley- Interscience 
5 Publication, "Chemistry of Nucleosides and Nucleotides" Ed. 
L.B.Townsend, v. 1-3, Plenum Press. 



Beispiel 3; 

10 

Sequenzanalyse mit 4 markierten NTs* 

Bei einer bevorzugten Ausf\ihrungsform der Erf indung werden alle 
vier in die Reaktion eingesetzten NTs* mit Fluoreszenz- 
15 farbstoffen markiert. 

3A. Rekonstruktion der ursprunglichen Sequenzen nach dem 
SchrotschuS-Prinzip ("Automated DNA sequencing and 
analysis" S. 231 ff. 1994 M. Adams et al. Academic Press, 
20 Huang et al. Genom Res. 1999 v. 9 S.868, Huang Genomics 1996 
v.33 S.21, Bonfield et al. NAR 1995 v. 23 S.4992, Miller et 
al. J.Comput .Biol. 1994 v.l S.257). (Dieses Prinzip ist 
insbesondere bei der Analyse neuer, unbekannter Sequenzen 
geeignet . ) 

25 

3A-lSequenzierung eines langen DNA-Stucks (Fig.l) 

Im folgenden soil anhand der Sequenzierung eines 1Mb langen 
DNA-Stiickes schematisch die Sequenzierung langer 

30 Nukleins&ureketten dargestellt werden (Fig. 1) . Der 
Sequenzierung liegt das Shotgun-Prinzip zugrunde 
("Automated DNA sequencing and analysis" S. 231 ff. 1994 M. 
Adams et al. Academic Press, Huang et al. Genom Res. 1999 
v.9 S.868, Huang Genomics 1996 v.33 S.21, Bonfield et al. 

35 NAR 1995 v.23 S.4992, Miller et al. J . Comput . Biol . 1994 v.l 

S.257) . Das zu analysierende Material wird fiir die 
Sequenzierungsreaktion vorbereitet, indem es in Fragmente 
von vorzugsweise 50 bis 1000 bp LSnge zerlegt wird. Jedes 
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Fragment wird anschliefiend mit einer Primerbindungss telle 
xand einem Primer versehen. Dieses Gemisch aus verschiedenen 
DNA-Fragmenten wird nun auf einer planen Oberflache 
fixiert. Die nicht gebundenen DNA- Fragment e werden durch 
5 einen Waschschritt entfernt, Danach wird die 
Sequenzierungsreaktion an der gesamten Reaktionsoberf lache 
durchgef uhrt . Zur Rekonstruktion einer 1 Mb langen DNA- 
Sequenz sollten die Sequenzen von NSKFs vorzugsweise langer 
als 300 NTs sein, durchschnittlich ca. 400 bp. Da pro 
10 Zyklus nur jeweils ein markiertes NT* eingebaut wird, sind 
mindestens 400 Zyklen zur Sequenzierung notwendig. 

Insgesamt ist zur Rekonstruktion der ursprunglichen Sequenz 
die etwa 10- bis 100 -f ache Menge an Rohsequenzen er f order - 
15 lich, d.h. 10 bis 100 Mb. Bei einer durchschnittlichen 
Sequenzlange von ca. 400 bp pro NSKF benotigt man entspre- 
chend 25.000 bis 250.000 DNA-Fragmente, urn mehr als 99,995% 
der Gesamtsequenz abzudecken. 

20 Die ermittelten NSKF- Sequenzen stellen eine Population von 
uberlappenden Teilsequenzen dar, die sich mit kommerziell 
erhaltlichen Programmen zur Gesamtsequenz der NSK zusammen- 
fugen lassen ("Automated DNA sec[uencing and analysis" S. 
231 ff. 1994 M. Adams et al. Academic Press , Huang et al. 

25 Genom Res. 1999 v. 9 S.868, Huang Genomics 1996 v. 33 S.21 # 
Bonfield et al. NAR 1995 v. 23 S.4992, Miller et al. 
J.Comput.Biol. 1994 v.l S.257). 

3A-2Sequenzierung der Genprodiikte am Beispiel der cDNA-Sequen- 
30 zierung 

In einer bevorzugten Aus fuhrungs form kdnnen statt einer 
Sequenz mehrere Secjuenzen in einem Ansatz analysiert 
werden. Die ursprunglichen Sequenzen konnen aus den 
35 gewonnen Rohdaten z.B. nach dem SchrotschuS-Prinzip 
rekonstruiert werden. 



ZunSchst werden NSKFs erzeugt. Man kann z.B. mRNA in eine 
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doppelstrangige cDNA uberfuhren und diese cDNA tnit Ul- 
traschall f ragmentieren. AnschlieSend werden diese NSKFs 
tnit einer Primerbindungsstelle versehen, denaturiert, 
immobilisiert und mit einem Primer hybridisiert . Zu 
5 beachten ist bei dieser Variante der Probenvorbereitung, 
dass die cDNA-Molekule unvollstandige mRNA-Sequenzen 
darstellen konnen (Method in Enzymology 1999 f v. 303, S.19 
und andere Artikel in diesem Band, "cDNA library protocols" 
1997 Humana Press) . 

10 

Eine andere Moglichkeit bei der Generierung 
einzelstrangiger NSKFs von mRNA besteht in der reversen 
Transkription der mRNA mit randomisierten Primern. Dabei 
werden viele relativ kurze antisense DNA-Fragmente gebildet 

15 (Zhang- J et al. Biochem.J. 1999 v. 337 S.231, Ledbetter et 

al. J.Biol.Chem. 1994 v. 269 S. 31544, Kolls et al. 
Anal.Biochem. 1993 v. 208 S.264, Decraene et al. 
Biotechniques 1999 v. 27 S.962) . Diese Fragmente konnen 
anschliefcend mit einer Primerbindungstelle versehen werden 

20 (s.o) . Weitere Schritte entsprechen oben beschriebenen 

Vorgangen. Mit dieser Methode konnen komplette mRNA- 
Sequenzen (vom 5'- bis zum 3 ! -Ende) analysiert werden, da 
die randomisierten Primer Qber die gesamte Lange der mRNA 
binden. 

25 

Immobilisierte NSKFs werden mit einer der oben angefuhrten 
Ausfuhrungsformen der Sequenzierung analysiert. Da mRNA- 
Sequenzen wesentlich weniger repetitive Sequenzen aufweisen 
als z.B. genomische DNA, kann die Anzahl der detektierten 
30 Signale der eingebauten NTs* von einem NSKF geringer als 300 
sein und liegt vorzugsweise zwischen 20 und 1000. Die 
Anzahl der NSKFs, die analysiert werden miissen, errechnet 
sich nach denselben Prinzipien wie bei einer SchrotschuS- 
Rekonstruktion einer langen Sequenz. 

35 

Aus NSKF- Sequenzen werden nach den Prinzipien des Schrot- 
schuS-Verfahrens die urspiiinglichen Gensequenzen rekon- 
struiert . 
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Diese Methode erlaubt die gleichzeitige Sequenzierung von 
vielen mRNAs ohne vorherige Klonierung. 

5 3B. Analyse von Sequenzvarianten 

Die Bestatigung einer bereits bekannten Sequenz oder der 
Nachweis von Varianten dieser Sequenz stellt sehr viel 
geringere Anspruche an die Lange und Redundanz der 

10 ermittelten NSKF- Sequenz en. Auch die Sequenzbearbeitung ist 
in diesem Fall einfacher. Die Vollsequenz braucht nicht neu 
rekonstruiert zu werden. Die NSKF- Sequenzen werden vielmehr 
mit Hilfe eines kommerziell erhaltlichen Programme der 
Vollsequenz zugeordnet und eventuelle Abweichungen 

15 detektiert. Einem solchen Programm kann z.B. BLAST oder 
FASTA Algorithmus zugrunde liegen ("Introduction to 
computational Biology" 1995 M.S. Waterman Chapman & Hall) . 

Die zu analysierende Sequenz wird mit einer der oben 
20 genannten Methoden in NSKFs uberfuhrt. Diese NSKFs werden 
mit dem erf indungsgemaEen Verfahren sequenziert, wobei man 
sowohl einen einheitlichen Primer und eine einheitlihe 
Primerbindungsstelle als auch unterschiedliche, 

sequenzspezif ische Primer und naturliche, in der zu 
25 untersuchenden Gesamt sequenz vorkommende 

Primerbindngsstellen, s. Beispiel 5, verwenden kann. 
AnschlieSend werden die ermittelten Sequenzen von NSKFs 
nicht nach dem SchrotschuS-Verfahren zusammengestzt, 
sondern mit der Referenzsequenz verglichen und auf diese 
30 Weise ihren Positionen in der Vollsequenz zugeordnet. Dabei 
kann es sich urn genomische oder cDNA- Sequenzen handeln. 

Im Gegensatz zu einer Rekonstruktion nach dem Schrotschufi- 
Verfahren braucht man fur die Analyse einer Sequenzvariante 
35 erheblich weniger Rohsequenzdaten. So kann die 5- bis 10- 
fache Rohsequenzmenge ausreichend fur die Wiederherstellung 
einer neuen Variante einer Vollsequenz sein. Mit dem 
Schrotschufc-Verfahren wird fur eine Wiederherstellung eine 
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10- bis 100 -f ache Menge an Rohsequenzen benotigt 
("Automated DNA sequencing and analysis" S. 231 ff . 1994 M. 
Adams et al. Academic Press, Huang et al. Genom Res. 1999 
v. 9 S.868, Huang Genomics 1996 v. 33 S.21, Bonfield et al. 
5 NAR 1995 v. 23 S.4992, Miller et al. J . Comput . Biol . 1994 v.l 
S.257). 

Die LcLnge der ermittelten NSKF-Sequenzen soil fur eine 
eindeutige Zuordnung zu einer bestimmten Position in der 

10 Referenzsequenz ausreichend sein, so konnen z.B bereits 
Sequenzen mit einer L&nge von 20 NTs (z.B. aus nicht 
repetitiven Abschnitten im menschlichen Genom) eindeutig 
identif iziert werden. FQr die Vergleichsanalyse der repet- 
itiven Abschnitte werden langere Sequenzen benotigt. Die 

15 genaue Lange der Sequenzen hangt dabei von der Aufgaben- 
stellung ab. Vorzugsweise betragt die Lange der ermittelten 
NSKF-Sequenzen bei der Analyse von nicht repetitiven 
Abschnitten mehr als 20 NTs. Fur die Analyse der 
repetitiven Abschnitte liegt sie vorzugsweise xiber 500 NTs. 

20 

Die Zielsetzungen bei der Sequenzierung neuer Varianten 
einer bereits bekannten Vollsequenz konnen sehr unter- 
schiedlich sein. Meist wird ein Vergleich der neu ermittel- 
ten Sequenz mit der bekannten Vollsequenz /Referenzsequenz 

25 angestrebt. Dabei kdnnen die beiden Sequenzen aus evolutio- 
nar unterschiedlich weit auseinanderliegenden Spezies 
stammen. Verschiedene Parameter der Zusammensetzung dieser 
beiden Sequenzen konnen verglichen werden. Als Beispiele 
fur eine solche Analyse dienen: Mutations- oder 

30 Polymorphismusanalysen und die Analyse von alternativ ge- 
spleiSten Genprodukten. 

Nachfolgend soli schematisch und beispielhaft ein Vergleich 
der zu untersuchenden Sequenz mit einer Referenzsequenz 
35 ohne vorherige Rekonstruktion der zu analysierenden Sequenz 
betrachtet werden. Ein solcher Vergleich kann z.B. zur 
Mutations- oder SNP- Analyse dienen. 
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Eine lange, zu analysierende Sequenz, z.B. 1 Mb, wird in 
NSKFs mit einer der oben genannten Methode geteilt. Diese 
5 NSKFs werden unter Verwendung einheitlicher Primer mit dem 
erf indungsgemaSen Verfahren sequenziert. Die ermittelten 
Sequenzen von jedem einzelnen NSKF werden direkt mit der 
Referenzsequenz verglichen. Die Referenzsequenz dient dabei 
als Grundlage fur die Zuordnung ermittelter NSKF- Sequenzen, 

10 so dass die aufwendige Rekonstruktion nach dem SchrotschuS- 
Verfahren entfailt. Vorzugsweise betr&gt die Lange der 
ermittelten NSKF -Sequenzen bei der Analyse von nicht- 
repetitiven Abschnitten mehr als 20 NTs. Fur die Analyse 
der repetitiven Abschnitte liegt sie vorzugsweise uber 500 

15 NTs . Die Anzahl der zu analysierenden NSKFs richtet sich 
dabei nach der Gesamt lange der zu untersuchenden Sequenz, 
der durchschnittlichen LSnge der NSKF- Sequenzen und der 
notwendigen Genauigkeit der Sequenz ierung. Bei einer durch- 
schnittlichen Lange der ermittelten NSKF-Sequenz von 100 

20 NTs, einer Gesamt lange der zu untersuchenden Sequenz von 1 
Mb und einer Genauigkeit, die der Rohsequenzermittlung 
entspricht (d.h. jede Stelle soil moglichst nur einmal 
sequenziert werden) benotigt man z.B. die ca. 5 -f ache Menge 
an Rohsequenzen, d.h. 5 Mb, weil die Verteilung der NSKFs 

25 uber die Gesamtsequenz zufallig erfolgt. Insgesamt mussen 
50.000 NSKFs analysiert werden, urn mehr als 99% der 
Gesamtstrecke abzudecken. 



AnschlieSend werden die ermittelten NSKF- Sequenzen mit 
30 Hilfe eines kommerziell erhaltlichen Programms der 
Vollsequenz zugeordnet und eventuelle Abweichungen 
detektiert. Einem solchen Programm kann z.B. BLAST oder 
FASTA Algorithmus zugrunde liegen ("Introduction to 
computational Biology" 1995 M.S. Waterman Chapman & Hall). 



35 
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Sequenzanalyse mit 2 markierten NTs* und 2 unmarkierten NTs 
(2NTs* / 2NTs-Methode) . 

5 

In einer anderen Ausfuhrungsform werden fur die Analyse der 
Sequenzen 2 modif izierte NTs* und 2 unmodif izierte NTs einge- 
setzt . 

10 Diese Methode eignet sich besonders zur Analyse der Sequenzva- 
rianten (z.B. SNP- Oder Mutationsanalyse) und setzt die 
Kenntnis einer Referenzsequenz voraus. Dabei wird die 
Vollsequenz nicht rekonstruiert, sondern die ermittelten 
Sequenzen werden mit Hilfe eines Progratrans der Referenzsequenz 

15 zugeordnet und eventuelle Abweichungen registriert- Einem 
solchen Programm kann z.B. der BLAST oder FASTA Algorithmus 
zugrunde liegen ("Introduction to computational Biology" 1995 
M.S. Waterman Chapman & Hall) . 

20 Diese Ausfuhrungsform beruht auf dem Prinzip, dass eine Abfolge 
aus 2 Signalen (markierte NT*s) genugend Informationen zur 
Identif izierung einer Sequenz enthalten kann. Die ermittelte 
Sequenz wird mit der Referenzsequenz verglichen und einer 
bestimmten Position zugeordnet, z.B.: 

25 

ACCAAAACACCC - ermittelte Sequenz (dCTP* und dATP* sind 
markiert) 

ATCATCGTTCGAAATATCGATCGCCTGATGCC - Referenzsequenz 

30 

A-C C-AAA-A-C-A-C-CC (zugeordnete ermittelte Sequenz) 

ATCATCGTTCGAAATATCGATCXXICTGATGCC (Referenzsequenz ) 

35 Die unbekannte, zu analysierende Variante der Referenzsequenz 
wird wie oben beschrieben zur Sequenzierung vorbereitet (NSK 
wird in NSKFs uberfiihrt, diese werden mit PBS ligiert, 
anschliefiend mit einem Primer hybridisiert und auf 
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Reaktionsoberflache . immobilisiert) . Auf diese Weise 
vorbereitete NSKFs werden mit 2NTs*/2NTs-Methode sequenziert. 
Man erh&lt NSKF-Sequenzen, wobei jede NSKF-Sequenz eine Abfolge 
aus 2NTs* darstellt. Urn eine eindeutige Zuordnung der 
5 ermittelten Sequenz zu einer bekannten Referenzsequenz zu 
ermoglichen, mufi diese Abfolge lang genug sein. Vorzugsweise 
betragt die Lange der ermittelten NSKF-Sequenzen mehr als 40 
NT*s. Da 2 markierte NTs* nur einen Teil der Sequenz darstellen, 
ist die Gesamtlange des synthetisierten komplementaren Strangs 
10 ca. doppelt so lang, wie die Abfolge der detektierten NTs* (bei 
40 detektierten NTs* betragt die Gesamtlange z.B. 
durchschnittlich 80 NTs) . 

Zur Synthese eines komplementaren Stranges werden 4 Nukleotide 
15 benotigt. Da die mit einem Fluoreszenzfarbstof f markierten NTs* 
in der vorliegenden Erfindung als Semiterminatoren auftreten, 
d.h. die Termination ausschliefilich bei Verfugbarkeit modif i- 
zierter NTs* auftritt, mussen unmodif izierte NTs in einem zu- 
satzlichen Schritt in jedem Zyklus in die Reaktion zugegeben 
20 werden. Die genaue Position dieses Schrittes in dem Zyklus kann 
variieren. Wichtig dabei ist, dass die markierten NTs* und die 
unmodif izierte NTs getrennt verwendet werden. 

Ein Zyklus bei dieser Aus fuhrungs form kann beispielhaft folgen- 
25 dermafien aussehen: 

a) Zugabe einer L5sung mit modif izierten NTs* und Polymerasen 
auf die Oberf lSche mit den bereitgestellten NSKFs 

b) Inkubation der immobilisierten Nukleins&ureketten mit 
30 dieser Losung unter Bedingungen, die zur Verlangerung der 

komplementaren Strange urn ein NT geeignet sind 

c) Was chen 

d) Detektion der Signale von einzelnen, modif izierten und in 
die den NSKFs komplementaren neusynthetisierten Strangen 

35 eingebauten NTs*-Molekulen 

e) Entfernung der Markierung und der terminierenden Gruppe bei 
den eingebauten Nukleotiden 

f) Waschen 



WO 02/088382 PCT/EP02/04659 

- 61 - 

g) Zugabe von 2 unmodif izierten NTs und Polymerasen 

h) Waschen. 



5 Diese 2NT*s/2NTs-Methode eignet sich beispielsweise fur die SNP- 
Analyse einer genomischen Strecke eines Gens oder fur doppel- 
strangige cDNA-Analyse. Ihr liegen folgende Prinzipien 
zugrunde : 

10 1) Die genetische Information in jedem der beiden komplementa- 
ren DNA-Strange ist identisch, so dass fehlende 
Informationen in einem Strang durch die Information aus dem 
anderen Strang vervollstandingt werden konnen. 

2) Durch bestimmte Paarkombinationen markierter NTs* kann man 
15 mit nur 2 NTs* die komplette Information aus einer doppel- 

strangigen DNA erhalten. Zulassige Kombinationen von NT*s 
bei dieser Ausfuhrungsform sind: A*C*; A*G* ; C*T*/C*U*; 
G*T*/G*U*. Bevorzugt wird die Kombination C* und U*. 

3) Als Grundlage der Analyse dient eine bereits bekannte Refe- 
2 0 renz sequenz . 

4) Die NSKFs stammen von beiden Strangen der zu analysierenden 
NSK und die ermittelten NSKF-Sequenzen decken die gesamte 
Lange der zu analysierenden Sequenz ab. 

25 Am folgenden Beispiel wird erklart, wie die Information aus 
einem doppelstrangigen DNA- Fragment mit nur 2 markierten NTs* 
gewonnen wird und wie die Unterschiede zur ursprunglichen oder 
nicht mutierten Sequenz (Referenzsequenz / Vergleichsequenz) 
festgestellt werden konnen. Sequenzen \mter (1) vind (2) sind 

30 bis auf eine Stelle identisch (unterstrichen) . A* und C* sind 
markiert . 

1) zu prvifende Sequenz: 

35 Die zu priifende Sequenz wird mit 2NT*s/2NTs-Methode sequenziert, 
so dass eine Population an NSKF-Sequenzen (ermittelte NSKF- 
Sequenzen (n) ) entsteht. Diese ermittelten NSKF-Sequenzen 
enthalten Information von jedem Strang: 
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5'A-g C-AAA-A-C-A-C-CC3 1 

5 1 ATeGTTCGAAATATCGATCGCCTG3 1 
3 1 TASCAAGCTTTATAGCTAGCGGAC5 » 
5 3' A-CAA-C---A-A-C-A-C---C5' 

2 ) Vergleichsequenz : 

Zur Analyse ist eine Vergleichsequenz (Referenzsequenz) 
10 erforderlich: 

5 1 ATTGTTCGAAATATCGATCGCCTG3 ' 
3 ' TA&CAAGCTTTATAGCTAGCGGAC5 » 

15 3) Vergleichsequenz mit angepaSten ermittelten NSKF-Sequenzen: 

Mit Hilfe eines Programms werden ermittelte NSKF-Sequenzen 
bestimmten Stellen in der Vergleichsequenz zugeordnet und 
eventuelle Abweichungen detektiert: 

20 

5 , A-C---C-AAA-A-C-A-C-CC3' - ermittelte NSKF-Sequenz (i) 
5 , AITGTTCGAAATATCGATCX3CCTG3 1 
3 1 TAACAAGCTTTATAGCTAGCGGAC5 1 

3 ' A-CAA-C A-A-C-A-C C5 ' - ermittelte NSKF-Sequenz (i+1) 

25 ft 

(Einzelnukleotidmutation) 

Mit dieser Ausfiihrungsform kann man eine doppelstrSngige 
NukleinsSure auf SNP oder Mutationen untersuchen. Dabei werden 

30 die ermittelten NSKF-Sequenzen mit einer Referenzsequenz 
verglichen. Die Grundregeln des Vergleichs einer Teilsequenz 
und einer kompletten Sequenz bei der Analyse mit nur 2 
markierten NTs unterscheiden sich nicht prinzipiell von denen, 
die bei dem Vergleich der Sequenzen anhand aller 4 markierten 

35 NTs* gelten. Naheres s. Sequenzvergleich bei Mutationsanalyse 
und SNP-Analyse mit 4NTs* (Beispiel 3B) . 



ermittelte NSKF-Sequenz ( i ) 



- ermittelte NSKF-Sequenz (i+1) 
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Beispiel 5: 

Eine besondere Ausfuhrungsform des Verfahrens stellt die 
Analyse von Einzelnukleotidpolymorphismen mit 

5 sequenzspezif ischen Primern dar. 

Zusatzlich zu Abschnitt 1 "Abkurzungen und 

Begriffserlauterungen" werden fur dieses Beispiel folgende 
Begriffe definiert: 

10 

Primer - Zur Verdeutlichung des erf inderischen Gedankens 
werden in diesem Beispiel folgende Begriffe unterschieden: 

a) Unter einem „ Primer" wird vorliegend allgemein eine 
Population von Primermolekxilen mit einheitlicher 

15 Struktur verstanden. 

b) „mehrere Primer u o.Sl. werden im Text als mehrere 
Populationen von Primermolekulen verstanden, die 
unter schiedliche Struktur besitzen. 

c) Ein „Primer-Molekul w bedeutet ein einziges 
20 Oligonukleotid-Molekul . 

d) „Mehrere Primer-Molekxile" bedeuten mehrere einzelne 
Oligonukleotid-Molekule; sie konnen einheitliche Oder 
unterschiedliche Struktur aufweisen. 

25 SNP-Stelle - eine Position in NSK, die auf Vorhandensein oder 
Abwesenheit von SNP untersucht wird. 

Zielsequenz - Teil einer Gesamtsequenz , der durch die 
Verwendung eines spezifischen Primers in der 

30 Sequenzierungsreaktion sequenziert/ bestimmt wird. Eine 
Gesamtsequenz kann mehrere Zielsequenzen enthalten. Eine 
Zielsequenz ist genugend lang, urn eine Positionierung dieser 
Zielsequenz innerhalb der Gesamtsequenz mit groSer 
Wahrscheinlichkeit zu gewahrleisten. Zielsequenzen k6nnen 

35 beispielsweise eine oder mehrere SNP-Stellen enthalten. 



Erkennungssequenz - Teil der Zielsequenz, der fur die 
Zuordnung dieser Zielsequenz in der Gesamtsequenz verwendet 
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wird. 

In dieser Ausfiihrungsform zur SNP-Analyse werden mehrere 
potent ielle SNP-Positionen in der Referenzsequenz ausgewahlt, 
5 die in einer zu analysierenden NSK untersucht werden. Zu 
diesen Posit ionen werden entsprechend unterschiedliche, 
sequenzspezif ische Primer bereitgestellt . Diese Primer konnen 
einen standardisierten Primersatz zur SNP-Analyse bei einer 
bestimmten Fragestellung bilden und einheitlich als Kit fur 
10 die betreffende Analysen eingesetzt werden. 

Die Vorbereitung des zu. analysierenden Materials (auf SNP zu 
untersuchende einzel- und doppelstrangige Nukleinsaureketten) 
hat erfindungsgemaS das Ziel, aus einer oder mehreren langen 
15 Nukleinsaureketten (Geisamtsequenz) eine Population an relativ 
kleinen, zwischen 30 und 2000 NT langen, einzelstrangigen 
Nukleinsaurekettenfragmenten (NSKFs) zu bilden. 

Diese NSKF-Molekule werden zuf&llig auf einer planen 
20 Oberfl&che mit einer Dichte zwischen 10 und 1.000.000 pro 100 

jxm 2 -, vorzugsweise 10 und 100 NSKFs pro 100 pm 2 , 100 bis 10.000 

pro 100 /xm 2 oder 10.000 bis 1.000.000 pro 100/zm 2 immobilisiert . 

An die auf der Oberflache gebundenen NSKFs werden Primer 

hybridisiert, so dass die Dichte der extensionsfahigen NSKF- 
25 Primer -Komplexe ca. 10-100 pro 100/xm 2 betragt. Nach der 

Hybridisierung werden nicht gebundene Primer entfernt und die 

Sequenzierungsreaktion gestartet. 

Durch eine Auswadil der Zielsequenzen und der 
30 sequenzspezif ischen Primer werden nur die relevanten 
Abschnitte der Gesamtsequenz untersucht, was die Menge nicht 
relevanter Inf ormationen verringert und die Analysezeit 
verkiirzt . 

35 Dieser Aus fiihrungs form des Verfahrens zur SNP-Analyse liegen 
folgende Prinzipien zugrunde: 

Es werden Stellen in einer Referenzsequenz ausgewahlt, die 
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in den zu untersuchenden NSKs (Gesamtsequenz) auf 
Einzelnukleotidpolymorphismen (SNPs) uberpruft werden 
sollen. 

5 1) Zur Analyse jeder ausgewahlten SNP-Stelle werden 
spezifische Primer bereitgestellt , so dass jede zu 
untersuchende SNP-Stelle entweder die nSchste Position in 
3 -Richtung vom Primer einnimmt Oder innerhalb von 2 bis 
100, vorzugsweise 2 bis 50, idealerweise 2 bis 20 

10 Positionen in 3 -Richtung vom Primer liegt. Die SNP- 

Stelle liegt somit innerhalb der Zielsequenz, die wahrend 
der Sequenzierungsreaktion bestimmt wird. Es werden 
vorzugsweise mehrere SNP-Stellen gleichzeitig analysiert, 
so dass mehrere spezifische Primer verwendet werden 

15 mussen. Die Primer werden vorzugsweise so ausgewahlt, 

dass sie mdglichst einheitliche Annealing-Temperaturen 
haben, d.h. Unterschiede zwischen Schmelz tempera turen 
einzelner Primerpopulationen liegen beispielsweise 
innerhalb eines Bereichs von ca. 4 Grad, besser innerhalb 

20 von 2 Grad, noch besser innerhalb von 1 Grad. 

2) Von der Gesamtsequenz werden kurze 
Nukleinsaurekettenfragmente (NSKFs) abgeleitet, wobei 
diese Fragmente einzelstrangig sind und eine Lange von 

25 20 bis 2000 NT, vorzugsweise 30 bis 500 NT besitzen. 

3) NSKF-Molekule werden in einer zufalligen Anordnung auf 
der Oberflache immobilisiert . 

30 4) Nach der Hybridisierung (Annealing) von 

sequenzspezif ischen Primern an die auf der Oberflache 
immobilisierten NSKFs wird eine zyklische 
Sequenzierungsreaktion durchgef uhrt , wobei ftir jedes an 
der Reaktion beteiligte NSKF-Molekul eine Zielsequenz 

35 ermittelt wird. Die Sequenzierungsreaktion lauft an 

vielen Molekulen gleichzeitig ab. 

5) Die ermittelten Zielsequenzen enthalten Information uber 
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die Zugehorigkeit zu einem bestimmten Abschnitt in der 
Gesamtsequenz und uber den SNP in diesem Abschnitt bei 
der zu untersuchenden Probe. Die Lange der Zielsequenzen 
und somit die Zahl der Zyklen ist so zu wahlen, dass eine 
5 Identif izierung der Sequenzen gewahrleistet werden kann. 

In einer vorteilhaf ten Aus fuhrungs form werden die 
ermittelten Zielsequenzen mit der Ref erenzsequenz 

10 verglichen und durch Sequenzubereinstimmung zugeordnet. 

Bei einer genugend langen ermittelten Zielsequenz kann 
man sie mit grofier Wahrscheinlichkeit zu einer bestimmten 
Position in der Ref erenzsequenz zuordnen. Beispielsweise 
kann eine Sequenz aus 10 NTs mehr als 10 6 verschiedene 

15 Kombinationen bilden und somit mit einer groSen 

Wahrscheinlichkeit in einer NSK von nur 100.000 NT 
eindeutig identif iziert werden. Nach der Zuordnung der 
ermittelten Zielsequenz zur bestimmten Position innerhalb 
der Ref erenzsequenz werden Unterschiede in den Sequenzen, 

20 die SNPs, sichtbar. 

Zur Identifizierung der Zielsequenzen wird in einer 
anderen vorteilhaf ten Aus fuhrungs form sowohl die bereits 
bekannte Anzahl der Primer, ihre Zusammensetzung und ein 

25 bereits bekannter, an die Primerbindungss telle 

anschlieSender Sequenzabschnitt der Ref erenzsequenz 
verwendet. Dabei werden die ermittelten Zielsequenzen 
nach ihrer Zugehorigkeit zu den Primern analysiert, wobei 
nur die nah an der Primerbindungsstelle liegenden 

30 Sequenzen berucksichtigt werden nuissen. Wenn 

beispielsweise nur 1000 Primer verwendet werden, reichen 
weniger als 10 NTs der ermittelten Zielsequenzen, urn eine 
Zuordnung zu den entsprechenden Primern zu ermoglichen. 

35 Die zu analysierende Probe enthSlt meistens mehrere identische 
Gesamtsequenzmolekule, z.B. mehrere Kopien von genomischer DNA 
aus Zellen eines Gewebes oder mehrere identische mRNA- 
Populationen aus Zellen eines Gewebes. 
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a) Wahl der SNP-Stelle 

Mit der erf indungsgem&Sen Methode kann man sowohl bekannte SNP- 
Stellen analysieren als auch neue SNP-Stellen ermitteln. Als 
5 potentielle SNP-Stelle kann jede Position in der NSK auftreten. 
Die Auswahl richtet sich nach der Fragestellung, z.B. SNP- 
Analyse in Genen, deren Produkte mit bestitnmten Krankheiten 
assoziiert sind, oder SNP-Analyse in konservierten, kodierenden 
Abschnitten der Gene, die fur Membranrezeptoren kodieren, oder 
10 Uberprufung bekannter SNP-Stellen in regulatorischen Sequenzen 
von Genen, die fur die Zellteilung wichtig sind. 

Eine zu analysierende SNP-Stelle liegt innerhalb einer 
Zielsequenz, die wShrend der Sequenzierungsreaktion bestimmt 

15 wird. Man kann mehrere SNP-Stellen innerhalb einer Zielsequenz 
ermitteln. Man kann andererseits auch mehrere Zielsequenzen 
z.B. innerhalb eines Gens wahlen. Wichtig dabei ist, dass die 
Zielsequenzen in genugendem Abstand voneinander in der 
Gesamtsequenz liegen. Dieser Abstand ist notwendig, damit nur 

20 ein secjuenzspezif ischer Primer pro NSKF hybridisiert, \ind er 
ist von der durchschnittlichen NSKF-LSnge abhangig: je kurzer 
die NSKFs, desto naher aneinander konnen Zielsequenzen liegen. 
Die SNP-Stellen konnen bei angemessener Primer-Wahl an beiden 
StrSngen einer doppelstrangigen Nukleinsaurekette analysiert 

25 werden. 

Das Verfahren bietet auch die Moglichkeit, beispielsweise 
mehrere SNP-Stellen aus vielen Individuen (als Stichprobe 
einer Population) gleichzeitig zu kontrollieren. Dadurch kann 
30 z.B. das SNP-Profil einer Population untersucht werden. 

b) Primer fur die Sequenzierungsreaktion 

Sequenzierungsreaktion an einem einzelnen NSKF-Molekul wird 
durch ein Primer-Molekul ermoglicht. Ein sequenzspezif ischer 
35 Primer ist erf indungsgemaS notwendig, urn die 
Sequenzierungsreaktion jeweils an einer bestitnmten / 
spezifischen Zielsequenz innerhalb der Gesamtsequenz 
durchfuhren zu konnen. Der fttr die Analyse einer SNP-Stelle, 



4 * 

WO 02/088382 



PCT/EP02/04659 



- 68 - 

bzw. einer Zielsequenz einzusetzende sequenzspezif ische Primer 
stellt eine Population von Primer-Molekulen mit identischer 
Struktur dar. Pur die Analyse mehrerer, unterschiedlicher 
Zielsequenzen sind mehrere unterschiedliche Primer- 
5 Populationen notwendig. 

Durch die Verwendung sequenzspezif ischer Primer werden nur die 
relevanten Sequenzabschnitte, die Zielsequenzen, analysiert. 
Im erf indungsgemaSen Verfahren wird die zu sequenzierende 
10 L&nge der Sequenzen m6glichst niedrig gehalten, damit die 
Geschwindigkeit der Analyse steigt. 

Ein sequenzspezif ischer Primer bindet an eine fur ihn 
spezifische Primerbindungsstelle in der zu analysierenden 

15 Sequenz, PBS. Die Zusammensetzung und die L&nge der Primer 
werden fur jede potentielle SNP-Stelle, bzw. Zielsequenz, 
optimiert. Beispiele fur Optimierungsschritte sind in Rychlik 
et al. NAR 1990 v. 18 S.6409 dargestellt. Bei der Primerwahl 
bzw. bei der Wahl der PBS (Primerbindungsstelle) sind folgende 

20 Aspekte besonders zu berucksichtigen: 

1) Die zu analysierende SNP-Stelle sollte entweder gleich nach 
dem 3 1 -Ende des Primers Oder innerhalb der nachsten 2 bis 50 
NTs, vorzugsweise 2 bis 20 NTs liegen . 

25 

2) Die Positionierung (die Wahl der Sequenzlange und der 
Zusammensetzung) der PBS zu SNP-Stelle sollte so erfolgen, 
dass die verschiedenen PBS -Sequenzen und die 
korrespondierenden Primer- Sequenzen moglichst ahnliche 

30 „ Anneal ing- Tempera turen" besitzen, urn bei moglichst 
einheitlichen Hybridisierungsbedingungen zu binden. Das kann 
beispielsweise durch Ver&nderung der PBS-Position im Bezug 
auf die . jeweilige, zu analysierende SNP-Stelle oder durch 
die Veranderung der Primer sequenzlange erfolgen (Rychlik et 

35 al. NAR 1990 v. 18 S.6409). 

3) Der minimale Abstand zwischen Primern, die an denselben 
Strang in der Gesamtsequenz binden, sollte die 



« » 

WO 02/088382 PCT/EP02/04659 

- 69 - 

durchschnittliche NSKF-Lange nicht unterschreiten. 

Es konnen Primer fir beide Str&nge einer Doppelstrang-NSK 
verwendet werden. Damit lassen sich beispielsweise nah 
5 aneinander liegende SNP-Stellen erfassen, Oder man kann eine 
Kontrolle einer SNP-Stelle in beiden Strangen vornehmen. 

Vorzugsweise betragt die Lange des Primers zwischen 6 und 100 
NTs, optimalerweise zwischen 10-30 Oder 30-40 oder 40-50. Fur 
10 verschiedene SNP-Stellen, bzw. Zielsequenzen k6nnen Primer mit 
unterschiedlicher Lange eingesetzt werden. 

Fur die SNP-Analyse mit sequenzspezif ischen Primern werden 
Primer erf indungsgemaS in einer Hybridisierungslosung an die 
15 auf der Reaktionsoberf lache immobilisierten NSKFs hybridisiert 
(Anneal ing-Reakt ion) . 

c) Immobilisierung von NSKFs 

In dieser Ausfiihrungform werden erf indungsgemaS die NSKF- 
20 Primer-Komplexe ausschliefilich uber die NSKFs an die 
Oberfl&che gebunden (direkte Bindiing von NSKFs an die 
Oberf lache) , wobei die bereitges tell ten NSKF-Molekiile an die 
plane Oberf l&che in zufalliger Anordnung gebunden werden. 

25 Die Immobilisierung der NSKFs erfolgt vorzugsweise an einem 
der beiden Ketten-Enden (s.o.). Die Immobilisierung kann auch 
durch eine unspezif ische Bindung, wie z.B. durch Austrocknung 
der NSKFs enthaltenden Probe auf der planen Oberf lache 
erreicht werden. Die Dichte der Immobilisation kann zwischen 

30 10 und 100, 100 und 10.000, 10.000 und 1.000.000 NSKFs pro 100 
jun 2 liegen. 

d) Hybridisierung 

Die gebundenen NSKFs und die Primer werden unter stringenten 
35 Hybridisieiaingsbedingungen inkubiert, die eine moglichst 
selektive Anbindung (Annealing) der Primer an die 
entsprechenden Primerbindungsstellen der NSKFs erlauben. 
Optimale Hybridisierungsbedingungen hangen von der genauen 
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Struktur der Primerbindungsstellen und der jeweiligen 
Primers trukturen ab und lassen sich beispielsweise nach 
Rychlik et al. NAR 1990 v. 18 S.6409 berechnen. 

5 Die Primer stellen vorzugsweise ein Primergemisch dar. Die 
Konzentrationen einzelner sequenzspezif ischer Primer 
(Einzelkonzentrationen von Primer-Populationen) liegen 
beispielsweise zwischen 10pmol/l und lmmol/1, vorzugsweise 
zwischen 0.1/xmol/l und 10/imol/l. Die Gesamtkonzentration von 
10 Primern im Primergemisch liegt vorzugsweise zwischen lnmol/1 
und 10mmol/l. Das Verhaltnis zwischen einzelnen Primer - 
Populationen kann variieren. Primer konnen in deutlichem 
Uberschuss uber die immobilisierten NSKFs zugegeben werden, so 
dass die Hybridisierungszeit gering ist. 

15 

Die fur die Detektion notwendige Dichte von extensionsfahigen 
NSKF-Primer-Komplexen betragt ca. 10 bis 100 pro 100 /im 2 . Sie 
kann vor, wahrend oder nach der Hybridisierung der Primer 
erreicht werden. 

20 

Bei einer bekannten NSKF-Konzentration konnen in einer 
Ausfuhrungsform die Immobilisierungsbedingungen so gewahlt 
werden, dass die NSKFs in einer Dichte von ca. 10 bis 1000 
Molekule pro 100/xm 2 gebunden werden. NSKFs bestimmen somit die 
25 Dichte der NSKF-Primer-Komplexe. 

In einer anderen Ausfuhrungsform kcinn die Dichte der 
immobilisierten NSKFs wesentlich hoher als 1000 NSKFs pro 
lOOjim 2 liegen, z.B. 1.000.000 pro 100/xm 2 . Die fur die optische 
30 Detektion notwendige Dichte der NSKF-Primer-Komplexe wird 
wahrend der Primer-Hybridisierung erreicht. Dabei sind die 
Hybridisierungsbedingungen (z.B. Temperatur, Zeit, Puffer) so 
zu wahlen, dass die Primer nur an einen Teil der 
immobilisierten NSKFs binden, s. Beispiel 6. 

35 

Bei unbekannter NSKF-Konzentration und entsprechend 
unbekannter Immobilisationsdichte kann die Hybridisierung 
(Annealing) von Primern an die NSKFs zu einer hoheren als 
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optimale Dichte von NSKF-Primer-Komplexen fuhren. 

Aus diesem Grund wird in einer vorteilhaf ten Aus fuhrungs form 
ein Teil der NSKFs enthaltenden Probe fur die Ermittlung der 
5 optimalen Dichte verwendet. Dieser Teil wird auf einer 
Reaktionsoberf lache immobilisiert, die Primer werden an die 
NSKFs hybridisiert und die entstandenen NSKF- Primer- Komplexe 
werden durch den Einbau von Fluoreszenzfarbstof f tragenden 
NT*s (z.B. Cy3-dCTP, Amersham Pharmacia Biotech) markiert. Aus 

10 der ermittelten Dichte lasst sich einerseits die eventuell 
notwendige Verdunnung oder Konzentrierung der ursprunglichen 
Probe fur den endgiiltigen Sequenzierungsansatz errechnen (Die 
Hybridisierungsbedingungen werden beibehalten) . Andererseits 
konnen daraus notwendige Veranderungen in den 

15 Hybridisienmgsbedingungen errechnet werden, beispielsweise 
eine Verktirzung der Hybridisierungszeit , wobei die NSKF- 
Immobilisierungsdichte konstant bleibt. 

Das Mengen-Verhaltnis zwischen Primerpopulationen kann 
20 unterschiedlich oder gleich groS sein. Durch eine hohere 
Primerkonzentrationen konnen gewisse, beispielsweise seltenere 
Sequenzen mit groSerer Wahrscheinlichkeit in einem bestimmten 
Zeitraum gebunden werden. 

25 Der grofie Vorteil der beschriebenen Verfahrensanordnung 
gegenuber einer Verfahrensanordnung mit auf einer Oberflache 
immobilisierten sequenzspezif ischen Primern und einer 
anschliefienden Hybridisierung von Proben an diese Primer ist 
die deutliche Verkiirzung der Zeit fur die Hybridisierung 

30 (Annealing) zwischen den sequenzspezif ischen Primern und den 
zu analysierenden Proben auf der Reaktionsoberf lache. 
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Beispiel 6: 

Die Vorbereitung und die Durchfuhrung der 
Sequenzierungsreaktion 

5 

Die Vorbereitung der Gel-Oberf lSche: 

Das Polyacrylamid-Gel fiir die Analyse von Reaktionen mit 
einzelnen MoleJriilen wird nach allgemeinen Regeln der Gel- 
10 Vorbereitung fur elektrophoretische Auftrennung erstellt 
^Electrophoresis" A.T. Andrews, Oxford science publications 
1995) . 

Die Polymerisationsreaktion kann z.B. durch UV-Licht Oder 
15 durch Radikalbildner durchgefuhrt werden. In diesem Beispiel 

wird Ammoniumpersulfat (APS) und TEMED 

(Tetramethylethylendiamin) zur Radikalreaktion verwendet, z.B. 

TEMED 0.01% v/v und APS 0.04% w/v. Die 

Komponentenzusammensetzung kann breit variieren, die 
20 Konzentrationen einzelner Komponenten liegen in folgenden 

Bereichen (errechnet fur die gebrauchsf ertige wassrige AA- 

bisAA-Losung) : 

Acrylamid-Monomer (AA) von 3 bis 30%, idealerweise zwischen 10 
25 und 20% Bis-Acrylamid (bis-AA) im Verh&ltnis zum Acrylamid- 
Monomer 1:10 bis 1:50, vorzugsweise 1:20. 

Zur Herstellung werden 2 saubere Glasplatten verwendet (mit 
Aceton und danach Wasser gewaschen) . Eine Glasplatte (PI) wird 

30 vorzugsweise mit einem wasserabweisenden Reagenz vorbehandelt , 
z.B Repel-silan, Dimethyldichlorsilauie-Losung, Amersham 
Pharmacia-Biotech. P2 dient als fester Trager fur das Gel und 
kann mit gelbindenden Reagenzien z.B. Bind-silan, 
Methacryloxypropyl trimethoxysilane , Amersham Pharmacia- 

35 Biotech, vorbehandelt werden, so dass es zu einer kovalenten 
Bindung zwischen dem.Gel und der Glasoberf l&che kommt. Die P2- 
Vorbehandlvmg mit gelbindenden Reagentien ist dann sinnvoll, 
wenn mehrere Reaktionen mit immobilisierten Molekulen 
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durchgefuhrt werden mussen. Bei einer geringeren Anzahl an 
Reaktionen ist eine solche Vorbehandlung nicht notwendig. In 
diesen Fallen reicht, fur P2 eine saubere Glas-Oberf l&che aus, 
so dass das Gel allein durch adhasive Krafte an der 
5 Glasoberf lache haften bleibt. 

Die fertige Polymerisations losung (AA/bisAA- Losung mit 
Radikalbildnern) wird zwischen PI und P2 gegossen, so dass 
eine Schicht mit der Dicke von ca. 5 bis 30 /xm resultiert. Die 
10 Dicke des Gels kann z.B. durch Abstandhalter kontrolliert 
werden. Nach Erhartung wird PI entfernt. Das Gel bleibt auf P2 
haften. Es wird mit entionisiertem Wasser gewaschen. 

Das Gel kann direkt weiter verwendet werden oder in 
15 verschiedenen Fertigungsstadien getrocknet und gelagert 
werden. Vor einer Reaktion mit markierten Molekulen wird das 
Gel normalerweise einige Minuten in der Reaktions-Puf f erlosung 
aufgequollen und erst dann fiir die Reaktion eingesetzt. 

20 Auf eine so vorbereiteten Gel -Oberf lache werden NSKFs durch 
das Austrocknen immobilisiert . 

Beispielsweise wurde eine Losung (ca. 1/xl) einer Plasmid-DNA 
25 (mit Hind III linearisierte, durch Hitze in einzelstrangige 
Form uberfuhrte pMOS-Blue-Plasmid-DNA ca. 3400 NT lang # 
Konzentration 0.1/xg//il) auf ca. 10mm 2 der Gel -Oberf lache 
aufgetropft und bei 90° C zum Trocknen gebracht. Die errechnete 
Dichte der immobilisierten Plasmid-Molekule betrug ca. 1000 
30 pro 1/xm 2 . 

Als Primer wurde das Oligonukleotid 5 ' -AGTGAATTCGAGCTCGGTAC- 3 ' 
verwendet. Die Primerbindungsstelle (nachfolgend fettgedruckt) 
zusammen mit der fur die Analyse relevanten Verlangerung hat 
35 folgende Sequenz: 

5 ' -£TCCCC£SGTACCGAGCTCGAATTCACT- 3 ' 



Eine Flow- Cell (Mikrof lussigkeitskanal, MFK) , Fig. 6, mit der 
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Reaktionsoberflache als Deckel wurde zusammengebaut . Ein 

solcher MFK erlaubt einen schnellen Flussigkeitsaustausch 
unter der Geloberf l^che. 

5 Als Vorversuch wurde der Primer (errechnete Tm 45,3° C, 
0.1/xmol/l in 50mmol/l Tris-HCl pH 8,7) bei 45° C fur 10 Minuten 
mit der Plasmid-DNA auf der Oberflache hybridisiert 
(Annealing) . Nach einem Waschschritt wurde die Dichte der 
Plasmid-Primer-Komplexe kontrolliert . Die Kontrolle erfolgte 
10 durch den Einbau von dCTP-Cy3 (Amersham Pharmacia Biotech) 
unter Verwendung von Kl enow- Fragment (2Units pro 50/*l in 
20mmol/l Tris-HCl-Puf f er, pH 8,5, mit 5mmol/l MgCl 2 , 15 Minuten 
bei 30° C) . Dabei wird nur ein einzelnes dCMP-Cy3 in den 
wachsenden Strang eingebaut. 

15 

Als Detektionsapparatur diente Axioplan 2e (Zeiss) mit der 
CCD-Kamera AxioCam (Zeiss), Fig. 8. 

Die Signaldichte der einzelnen, eingebauten dCMP-Cy3-Molekule 
20 entspricht der Dichte der extensionsfahigen Plasmid-Primer- 
Komplexe. Unter den genannten Bedingungen betrug die Dichte 
der Plasmid-Primer-Komplexe durchschnittlich ca. 15 pro 100 jim 2 
und lag damit in der gewunschten GroSenordnung (Fig. 8a-c) . 
Auf einer zweiten, in gleicher Weise vorbereiteten Oberflache 
25 (mit Hind III linearisierte, durch Hitze in einzelstrangige 
Form uberfiihrte pMOS-Blue-Plasmid-DNA ca. 3400 NT lang, 
Konzentration 0.1/xg//xl mit hybridisierten Primern) wird eine 
zyklische Sequenzierungsreaktion durchgef uhrt . Dabei werden 
dUTP-SS-CH 2 CH 2 NH-R-Cy3 (dUTP*) und dCTP - SS - CR^ CH 2 NH - R - Cy 3 
30 (dCTP*) (s. Beispiel 2) als reversible Terminatoren verwendet. 
Die Detektionsapparatur ist dieselbe wie im Vorversuch. 
Die fur die zyklische Sequenzierungsreaktion verwendeten 
Losungen setzen sich wie folgt zusammen: 

35 a) Reaktionslosung fiir die Einbaureaktion: 20 mmol/1 Tris-HCl- 
Puffer, pH 8.5, 5mmol/l MgCl 2 , 10% Glycerin, Klenow- 
Fragment (Amersham Pharmacia-Biotech) 2U pro 50/il, dUTP* 
bzw. dCTP*, Oder dATP und dGTP je 10 /xmol/1. 
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b) Waschlosung: 20 mmol/1 Tris-HCl pH 8.5, 0.01% Na-Azid 

c) Reaktionslosung fiir die Abspaltungsreaktion: 20 mmol/1 
5 Tris-HCl, pH 8.5 f 50mmol/l Mercaptoethanol . 

Die Einbaureaktionen mit markierten NT*s wurden bei 30°C fCtr 15 
Minuten durchgef iihrt . 

10 Im ersten Zyklus der Sequenzierungsreaktion wurde eine 
Reaktionslosung mit dCTP* zugegeben. Nach einem Waschschritt 
wurde ein Detektionsschritt durchgef iihrt , wobei Einzelmolekul- 
Signale mit den zugeordneten x,y-Koordinaten auf der 
Oberflache registriert wurden (insgesamt ca. 11.200 Signale) . 

15 Danach wurde die Markierung von den eingebauten NT*s 
abgespalten (Raumtemperatur, 10 Minuten) und die Oberflache 
gewaschen . 

Im zweiten Zyklus wurde eine Reaktionslosung mit dUTP* 
20 zugegeben und 15 Minuten lang bei 30° C inkubiert. Nach einem 
anschlieSenden Waschschritt wurden die Einzelmolekul-Signalen 
auf der Oberflache detektiert (insgesamt ca. 200 Signale) . 
Dies entspricht dem Hintergrundsignal, das durch eine 
unspezifische Bindung der NT*s an die Oberflache entsteht. Die 
25 Markierung von den NT*s wurde abgespalten (Raumtemperatur, 10 
Minuten) und die Oberflache mit der Waschlosung gewaschen. 

Im dritten Zyklus wurde eine Reaktionslosung mit dATP und dGTP 
zugegeben und 15 Minuten lang bei 30° C inkubiert. AnschlieSend 
30 wurde die Oberflache gewaschen. 

Die Zyklen 1 bis 3 wurden drei mal wiederholt, wobei insgesamt 
ca. 9900 CCU-Zielsequenzen ermittelt wurden. Diese Sequenzen 
konnen eindeutig dem Primer zugeordnet werden. 

35 
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Lejenden zu den Fiaur^n i 9 

Legende zu Pig. 1 

5 Schematische Darstellung der Sequenzierung einer langen 
Nukleinsaurekette 

Der Sequenzierung und der Rekonstruktion von langen 
Nukleinsauresequenzen (NSKs) liegt das Shotgun- Prinzip 
10 zugrunde. Die Sequenz eines langen DNA-Stucks wird dabei durch 
die Sequenzierung kleiner Fragmente (NSKFs) und eine 
nachfolgende Rekonstruktion ermittelt. 

1) Ausgangsmaterial - die zu analysierende lange 
15 Nukleinsaurensequenz, Gesamtsequenz 

2) Fragmente von 50-1000 bp - die im Fragmentierungsschritt aus 
der Gesamtsequenz erzeugten NSKFs 

20 3) Fragmente mit jeweils einem Primer - NSKF- Primer- Komplexe 

4) Immobilisierte Fragmente - an die plane Oberflache gebundene 
NSKF- Primer -Komplexe, in dieser Aus fuhrungs form erfolgt die 
Bindung am 3*-Ende der NSKFs 

25 

5) Zugabe einer Losung mit Polymerasen und NT*s - der erste 
Schritt in einem Zyklus der Sequenz ierungsreakt ion 

6) Waschschritt - nach dem Einbauschritt wird die Oberflache 
30 gewaschen 

7) Detektion - die Signale von einzelnen eingebauten NT*s 
werden detektiert 

35 8) Entfernung der Markierung und der zur Termination fuhrenden 
Gruppe - zur Fortsetzung der Sequenzierungsreaktion werden die 
Markierung und das sterische Hindernis entfernt 
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Legende zur Pig. 2 

Beiapiele fur allgemeine Struktur von NSKF- Primer -Komplexen 

5 

Pig. 2a In dieser Ausfuhrungsform wird eine einheitliche 
Primerbindungsstelle (PBS) an das 3'-Ende der NSKFs 
angekoppelt und an diese PBS bindet ein einheitlicher Primer. 

10 Pig. 2b In dieser Ausfuhrungsform werden natiirlich vorkommende 
Primerbindungsstellen verwendet, daher werden Gemische 
spezifischer Primer verwendet 

1) Primer 

2) Primerbindungsstelle 
15 3) NSKF 

Legende zur Pig. 3 

Ein Beispiel fur die Ankopplung einer einheitlichen 
20 Primerbindungsstelle (PBS) , die eine funktionelle Gruppe zur 
Bindung an die Oberflache tragt. 

In diesem Fall wird ein doppelstrangiger Oligonukleotidkomplex 
(3a) , der beispielsweise eine Modif ikation an beiden Strangen 
25 hat (3b) , an die doppelstr^ngigen NSKFs liegiert (3c). Nach 
Denaturierung entstehen einzelstrangige NSKFs mit 
einheitlicher PBS (3d) . 

30 Legende zur Fig. 4 

Ein anderes Beispiel fur die Erzeugung einer einheitlichen 
Primerbindungsstelle (PBS) . 

35 In diesem Fall werden NTs an das 3'-Ende der einzelstr&ngigen 
NSKFs angekoppelt (ein so genanntes „Tailing w ) . Durch 
Verwendng eines einheitlichen NT entsteht eine einheitliche 
PBS. 
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Legende zur Fig. S 

5 Beispiel fur die Bindung von NSKFs an eine gelartige 
Reaktionsoberf lache • 

Auf einer festen Unterlage (1) haftet eine Gelschicht (2), 
z.B. ein Polyacrylamidgel (Fig. 5a), oder haften viele 
10 Gelkugelchen (5), z.B. Agarosekugelchen (Fig. 5b). An die 
Oberf lache des Gels sind NSKFs (4) gebunden. Die NSKFs tragen 
eine funktionelle Gruppe, z.B. Biotin, und sind an das Gel 
uber Streptavidin oder Avidin (3) gebunden. 

15 

Legende zur Fig, 6 

Beispiel fur eine Durchf lussvorrichtung 

20 Eine gelartige Reaktionsoberf lache (1) ist auf einer fur das 
Anregungs- und Fluoreszenzlicht durchlassige festen Unterlage 
(2) befestigt. Sie bilden zusammen den Deckel der Flow-Cell. 
Die Flussigkeiten in der Flow-Cell konnen kontrolliert 
ausgetauscht werden, wobei die Flow-Cell zusammen mit 

25 Vorratsbehalter (3), Pumpe (4) und Ventil (5) eine 
Durchf lussvorrichtung bilden. Auf der Reaktionsoberf l&che sind 
NSKF- Primer- Komplexe gebunden (hier nicht abgebildet) . Die 
Signale der eingebauten NT*s werden mit der 
Detekt ionsapparatur ( 6 ) detekt iert . 

30 

Legende zur Fig. 7 

Strukturen von 2"-Deoxynukleosidtriphosphaten, die im Verfahren 
eingesetzt werden konnen. 

35 

Fig. 7a - Schematische Darstellung der NT-Struktur, bei der 
die spaltbare Gruppe und die sterisch anspruchsvolle, zur 
Termination fuhrende Gruppe Teile des Linkers bilden. Der 
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Linker ist die Verbindung zwischen Nukleobase und 
Fluoreszenzf arbstof f . 

A, B,C,D, E - Linker, A -der Linkerrest nach der Spaltung, B - 
spaltbare Gruppe, D - sterisch anspruchsvolle, zur Termination 
5 fuhrende Gruppe, F - Fluoreszenzf arbs tof f . 

Fig. 7b - Schematische Darstellung der NT-Struktur, wobei die 
spaltbare Gruppe ein Teil des Linkers ist und der 
Fluoreszenzf arbstof f gleichzeitig die sterisch anspruchsvolle, 
10 zur Termination fiihrende Gruppe darstellt. 

A,B,C - Linker, A - der Linkerrest nach der Spaltung, B - 
spaltbare Gruppe, D - sterisch anspruchsvolle, zur Termination 
fuhrende Gruppe, F - Fluoreszenzf arbstof f . 

15 Fig. 7c - Schematische Darstellung der Struktur von 
eingebauten NT*s nach dem Abspaltungsschritt . Dargestellt sind 
zwei NT*s mit dem verbliebenen Linkerrest (A) . 

Fig. 7d - Schematische Darstellung der NT-Struktur, wobei die 
20 spaltbare Gruppe, die gleichzeitig die sterisch 
anspruchsvolle, zur Termination fuhrende Gruppe ist, einen 
Teil des Linkers darstellt. 

A,B,C,D - Linker, A - der Linkerrest nach der Spaltung, B - 
spaltbare Gruppe, D - sterisch anspruchsvolle, zur Termination 
25 fuhrende Gruppe, F - Fluoreszenzf arbstof f . 

Fig. 7e - Darstellung von bevorzugten NT-Strukturen, bei denen 
der Linker an die 5-Position im Pyrimidinring angekoppelt ist. 

30 Fig. 7f - Darstellung anderer bevorzugter NT-Strukturen, bei 
denen der Linker an die 5 -Position im Pyrimidinring 
angekoppelt ist. 

Fig. 7g - Darstellung von bevorzugten NT-Strukturen, bei denen 
35 der Linker an die 7-Position im Purinring angekoppelt ist. 

Fig. 7h,i,j - Beispiele fur die Ankopplung von Farbstoffen an 
den Linker 
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Pig. 7k 

Strukturen von weiteren 2'-Deoxynukleosidtriphosphaten, die im 
Verfahren eingesetzt werden konnen. Der Linker ist an die 5- 
5 Position des Pyrimidinrings gekoppelt. 

Die Substituenten R 1# 2, 3 , 4 sind wahlbar und konnen unabhangig 
voneinander auftreten. 

10 Die Z-Gruppe stellt in einer Ausfuhrungsform (7k-l) die 
Verbindung. zwischen dem Linker und der Base dar. Sie ist 
wahlbar und kann eine Amid-, Carbalcoxy- (Ester), Sulfoxy-, 
Ether-, Thioether- oder Aminogruppe sein. 

15 Die E-Gruppe stellt in einer Ausfuhrungsform (7k-l) einen 
internen Teil des Linkers dar. In einer anderen 
Ausfuhrungsform (7k- 2) stellt sie die Verbindung zwischen dem 
Linker und der Base dar. Diese Gruppe ist wShlbar und kann 
eine unverzweigte Alkyl- oder Alkenylkette mit einer Zahl von 

20 Kohlenstof fatomen, vorzugsweise zwischen 1 und 5, sein. 

Die E-Gruppe kann aber auch eine Alkyl- oder Alkenylkette mit 
einer internen Amid- Carbalcoxy- (Ester), Sulfoxy-, Ether-, 
Thioether- oder Aminobindung sein. 

25 Die C-Gruppe ist in diesem Beispiel eine chemisch spaltbare 
Gruppe. In den Ausfuhrungsformen (7k-l,2) stellt sie einen 
internen Teil des Linkers dar. In einer anderen 
Ausfuhrungsform (7k- 3) stellt sie die Verbindung zwischen dem 
Linker und der Base dar. Diese Gruppe ist wahlbar und kann 

30 eine Ester-, Thioester- und Disulf idverbindung sein. 

Die Y-Gruppe stellt einen internen Teil des Linkers dar, der 
die Verbindung zwischen der spaltbaren Gruppe (C) und dem 
Fluoreszenzfarbstof f (F) herstellt. Diese Gruppe ist w&hlbar 
35 und kann eine verzweigte oder unverzweigte Alkyl- oder 
Alkenylkette oder auch eine substituierte oder unsubstituierte 
Arylgruppe sein. Eine weitere mogliche Alternative ist eine 
Alkyl- oder Alkenylkette mit einer internen Amid- Carbalcoxy- 
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(Ester), Sulfoxy-, Ether-, Thioether- oder Aminobindung. 

Die X-Gruppe ist die Verbindung zwischen dem 
Fluoreszenzfarbstoff und dem Linker, wobei diese Verbindung 
5 sowohl vom Linker, als auch vom Fluoreszenzfarbstoff (F) 
abgeleitet werden kann. Sie ist wahlbar und kann eine Amid-, 
Carbalcoxy- (Ester), Sulfoxy-, Ether-, Thioether- oder 
Aminogruppe sein. 

10 Fig. 7L 

Strukturen von weiteren 2'-Deoxynukleosidtriphosphaten, die im 
Verfahren eingesetzt werden konnen. Der Linker ist an die 7- 
Position des Purinrings gekoppelt. 

15 Die Substituenten Rx, 2 , 3 , 4 sind wahlbar und konnen unabhangig 
voneinander auftreten. 

Die Z-Gruppe stellt in einer Ausfuhrungsform (7L-1) die 
Verbindung zwischen dem Linker und der Base dar. Sie ist 
20 wahlbar und kann eine Amid-, Carbalcoxy- (Ester), Sulfoxy-, 
Ether-, Thioether- Oder Aminogruppe sein. 

Die E-Gruppe stellt in einer Ausfiihrungsform (7L-1) einen 
internen Teil des Linkers dar. In einer anderen 

25 Ausfuhrungsform (7L-2) stellt sie die Verbindung zwischen dem 
Linker und der Base dar. Diese Gruppe ist wahlbar und kann 
eine unverzweigte Alkyl- oder Alkenylkette mit einer Zahl von 
Kohlenstof fatomen, vorzugsweise zwischen 1 und 5, sein. 
Die E-Gruppe kann aber auch eine Alkyl- oder Alkenylkette mit 

30 einer internen Amid- Carbalcoxy- (Ester), Sulfoxy-, Ether-, 
Thioether- oder Aminobindung sein. 

Die C-Gruppe ist in diesem Beispiel eine chemisch spaltbare 
Gruppe. In den Ausfuhrungsformen (7L-1,2) stellt sie einen 
35 internen Teil des Linkers dar. In einer anderen 
Ausfuhrungsform (7L-3) stellt sie die Verbindung zwischen dem 
Linker und der Base dar. Diese Gruppe ist wahlbar und kann 
eine Ester-, Thioester- und Disulf idverbindung sein. 
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Die Y-Gruppe stellt einen internen Teil des Linkers dar, der 
die Verbindung zwischen der spaltbaren Gruppe (C) und dem 
Fluoreszenzfarbstof f (F) herstellt. Diese Gruppe ist wahlbar 
5 und kann eine verzweigte oder unverzweigte Alkyl- oder 
Alkenylkette oder auch eine substituierte oder unsubstituierte 
Arylgruppe sein. Eine weitere mogliche Alternative ist eine 
Alkyl- oder Alkenylkette mit einer internen Amid- Carbalcoxy- 
(Ester) , Sulfoxy-, Ether-, Thioether- oder Aminobindung. 

10 

Die X-Gruppe ist die Verbindung zwischen dem 
Fluoreszenzfarbstof f und dem Linker, wobei diese Verbindung 
sowohl vom Linker, als auch vom Fluoreszenzf arbstof f (F) 
abgeleitet werden kann. Sie ist w&hlbar und kann eine Amid-, 
15 Carbalcoxy- (Ester), Sulfoxy-, Ether-, Thioether- oder 
Aminogruppe sein. 

Fig* 7m 

Weitere Beispiele fur Strukturen von 
20 2'-Deoxynukleosidtriphosphaten, die im Verfahren eingesetzt 
werden k6nnen. Der Linker ist an die 5 -Position des 
Pyrimidinrings gekoppelt. 

Die Substituenten Ri r2 ,3 #4 sind wdhlbar und konnen xinabhangig 
25 voneinander auftreten. 

Die Y-Gruppe stellt einen internen Teil des Linkers dar, der 
die Verbindung zwischen der spaltbaren Gruppe (C) und dem 
Fluoreszenzfarbstof f (F) herstellt. Diese Gruppe ist wahlbar 
30 und kann eine verzweigte oder unverzweigte Alkyl- oder 
Alkenylkette oder auch eine substituierte oder unsubstituierte 
Arylgruppe sein. Eine weitere mogliche Alternative ist eine 
Alkyl- oder Alkenylkette mit einer internen Amid- Carbalcoxy- 
(Ester) , Sulfoxy-, Ether-, Thioether- oder Aminobindung. 

35 

Die X-Gruppe ist die Verbindung zwischen dem 
Fluoreszenzf arbstof f und dem Linker, wobei diese Verbindung 
sowohl vom Linker, als auch vom Fluoreszenzf arbstof f (F) 
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abgeleitet werden kann. Sie ist wShlbar und kann eine Amid-, 
Carbalcoxy- (Ester), Sulfoxy-, Ether-, Thioether- oder 
Aminogruppe sein. 



5 

Legende zur Pig. 8 

Beispiel fur ein Detektionssystem 



10 Dargestellt ist ein Weitfeld-Optik-Detektionssystem. Nach dem 
Einbau von markierten NT*s wird die Oberflache (7) abgescannt, 
wobei die Fluoreszenzsignale von einzelnen, an die NTs 
gekoppelten Farbstof fmolekulen detektiert werden. 

15 Fig. 8a Schematische Darstellung eines Abschnittes der 
Reaktionsoberflache (grau) , der abgescannt wird. Die Kreise 
entsprechen jeweils der Aufnahme eines 2D-Bildes und 
reprasentieren die Flachen, von denen die Fluoreszenzsignale 
detektiert werden, Dabei werden pro Aufnahme mehrere Signale 

20 (beispielsweise 100 bis 10.000) von einzelnen Molekulen 
gleichzeitig registriert. Die Reaktionsoberflache wird in 
jedem Zyklus abgescannt, wobei wahrend des Scannvorganges 
mehrere Aufnahmen von unterschiedlichen Stellen der Oberflache 
gemacht werden. Dabei konnen bis zu mehreren Millionen Signale 

25 von eingebauten NT*s aufgenommen werden. Die hohe Parallelitctt 
ist die Grundlage fur die Geschwindigkeit des Verfahrens. 

Fig. 8b Eine Aufnahme (ein 2D-Bild) mit Signalen von 
einzelnen, eingebauten NT*s. Zur Versuchsbeschreibung siehe 
30 Beispiel 6. 

Fig. 8c Ausschnitt aus Abbildung 8b. Der Ausschnitt zeigt 
Signale von vier eingebauten NT*s. Jedes Signal besitzt 
charakteristische Eigenschaften der Einzelmolekulsignale (s. 
35 Beschreibung) und kann auf grund dieser i dent if iziert werden 
(vorzugsweise mit Hilfe eines Computer- Programms) . Jedem der 
identif izierten Signale werden die entsprechenden X,Y- 
Koordinaten zugeordnet. 
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Legende zur Pig* 9 

5 Beispiel einer vorteilhaf ten Anordnung von 

Reakt ionsober f lachen . 

Der Durchsatz wird durch Verwendung von zwei getrennten Flow- 
Cells (Mikrof lussigkeitskanale, MFK) erh&ht. Wahrend in der 
10 einen Flow- Cell biochemische und chemische Reaktionen 
ablaufen, wird in der . anderen die Detektion durchgef uhrt . 
AnschlieSend tauschen die Flow-Cells ihre Positionen. 



WO 02/088382 PCT/EP02/04659 

85 



gftfrefrt^gpijiche; 

1. Verfahren zur parallelen Sequenzanalyse von 
Nukleinsauresequenzen (Nukleinsaureketten, NSKs) , bei dem 
man 

Fragmente (NSKFs) einzelstrangiger NSKs mit einer Lange von 
etwa 50 bis 1000 Nukleotiden erzeugt, die uberlappende 
Teilsequenzen einer Gesamtsequenz darstellen konnen, man 

die NSKFs unter Verwendung eines einheitlichen oder 
mehrerer unter schiedlichen Primer in Form von NSKF-Primer- 
Komplexen auf einer Reaktionsoberf lache in einer zufalligen 
Anordnung bindet, man 

eine zyklische Aufbaureaktion des komplementaren Stranges 
der NSKFs unter Verwendung einer Oder mehrerer Polymerasen 
durchfuhrt, indem man 

a) zu den auf der OberflSche gebundenen NSKF-Primer- 
Komplexen eine Losung zugibt, die eine oder mehrere 
Polymerasen und ein bis vier modifizierte Nukleotide 
(NTs*) enthalt, die mit Fluoreszenzfarbstof fen markiert 
sind, wobei die bei gleichzeitiger Verwendung von 
mindestens zwei NTs* jeweils an den NTs* befindlichen 
Fluoreszenzfarbstof fe so gewShlt sind, dass sich die 
verwendeten NTs* durch Messung unterschiedlicher Fluo- 
reszenzsignale voneinander unterscheiden lassen, wobei 
die NTs* strukturell an der Base so modifiziert sind, 
dass die Polymerase nach Einbau eines . solchen NT* in 
einen wachsenden komplementaren Strang nicht in der 
Lage ist, ein weiteres NT* in denselben Strang ein- 
zubauen, wobei der Fluoreszenzfarbstof f abspaltbar ist 
und die strukturelle Modifikation ein abspaltbarer 
sterisch suispruchsvoller Ligand ist, man 

b) die in Stufe a) erhaltene station&re Phase \inter 
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Bedingungen inkubiert, die zur Verlangerung der kom- 
plementaren Strange geeignet sind, wobei die 
komplementaren Strange jeweils um ein NT* verlangert 
werden, man 

c) die in Stufe b) erhaltene station&re Phase unter 
Bedingungen wascht, die zur Entfernung nicht in einen 
komplementaren Strang eingebauter NTs* geeignet sind, 
man 

d) die einzelnen, in komplementare StrSnge eingebauten 
NTs* durch Messen des fur den jeweiligen Fluo- 
reszenzfarbstoff charakteristischen Signals detek- 
tiert, wobei man gleichzeitig die relative Position 
der einzelnen Fluoreszenzsignale auf der Reaktions- 
oberflache bestimmt # man 

e) zur Erzeugung unmarkierter (NTs Oder) NSKFs die Fluo- 
reszenzfarbstoffe und die sterisch anspruchsvollen 
Liganden von den am komplementaren Strang angefugten 
NTs* abspaltet, man 

f) die in Stufe e) erhaltene stationare Phase unter 
Bedingungen wascht, die zur Entfernung der Fluo- 
reszenzfarbstof fe und der Liganden geeignet sind, man 

die Stufen a) bis f) gegebenenfalls mehrfach wiederholt, 

wobei man die relative Position einzelner NSKF-Primer- 
Komplexe auf der Reaktionsoberf lache und die Sequenz dieser 
NSKFs durch spezifische Zuordnung der in Stufe d) in auf- 
einanderfolgenden Zyklen an den jeweiligen Positionen 
detektierten Fluoreszenzsignale zu den NTs bestimmt. 

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass man 
die Stufen a) bis f ) der zyklischen Aufbaureaktion mehrfach 
wiederholt, wobei man in jedem Zyklus nur jeweils ein 
markiertes NT* einsetzt. 
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3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass main 
die Stufen a) bis f ) der zyklischen Aufbaureaktion mehrfach 
wiederholt, wobei man in jedem Zyklus jeweils zwei unter- 
schiedlich markierte NTs* einsetzt. 

4. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass man 
die Stufen a) bis f ) der zyklischen Aufbaureaktion mehrfach 
wiederholt, wobei man in jedem Zyklus jeweils vier unter- 
schiedlich markierte NTs* einsetzt. 

5. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die 
NSKs Varianten einer bekannten Ref erenzsequenz sind und man 
die Stufen a) bis f ) der zyklischen Aufbaureaktion mehrfach 
wiederholt, wobei main in den Zyklen abwechselnd jeweils 
zwei unterschiedlich markierte NTs* und zwei unmarkierte NTs 
einsetzt und man die Gesamtsequenzen durch Vergleich mit 
der Ref erenzsequenz ermittelt. 

6. Verfahren nach den Anspruchen 1 bis 5, dadurch gekenn- 
zeichnet, dass man in die NSKFs jeweils eine Primerbin- 
dungsstelle (PBS) einfuhrt, wobei man bei doppelstrangigen 
NSKs an beiden komplementaren Einzelstrangen jeweils eine 
PBS einfuhrt und wobei die Primerbindungsstellen fur alle 
NSKFs jeweils gleiche oder verschiedene Sequenzen 
aufweisen. 

7. Verfahren nach den Anspruchen 1 bis 6, dadurch gekenn- 
zeichnet, dass man die NSKFs mit Primern in einer Losung 
unter Bedingungen in Kontakt bringt, die zur Hybridisierung 
der Primer an die Primerbindungsstellen (PBSs) der NSKFs 
geeignet sind, wobei die Primer untereinander gleiche oder 
verschiedene Sequenzen aufweisen, und man die gebildeten 
NSKF-Primer-Komplexe anschliefiend auf der Reaktionsober- 
flache bindet. 

8. Verfahren nach den Anspruchen 1 bis 6, dadurch gekenn- 
zeichnet, dass man die NSKFs zunachst auf der Reaktions- 
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oberflache immobilisiert und erst anschlieSend mit Primern 
unter Bedingungen in Kontakt bringt, die zur Hybridisierung 
der Primer an die Primerbindungsstellen (PBSs) der NSKFs 
geeignet sind, wobei NSKF- Primer -Komplexe gebildet werden, 
wobei die Primer untereinander gleiche oder verschiedene 
Sequenzen aufweisen. 

9. Verfahren nach den Anspriichen 1 bis 6, dadurch gekenn- 
zeichnet, dass man die Primer zunachst auf der 
Reaktionsoberf lache immobilisiert und erst anschliefiend mit 
NSKFs vinter Bedingungen in Kontakt bringt, die zur 
Hybridisierung der Primer an die Primerbindungsstellen 
(PBSs) der NSKFs geeignet sind, wodurch NSKFs an die 
Oberflache gebunden und NSKF- Primer- Komplexe gebildet 
werden, wobei die Primer untereinander gleiche oder 
verschiedene Sequenzen aufweisen. 

10. Verfahren nach den Anspriichen 1 bis 9, dadurch 
gekennzeichnet, dass die Dichte der extensions fahi gen NSKF- 
Primer-Komplexe zwischen etwa 10 und 100 pro 100/xm 2 liegt. 

11. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass 
die Nukleinsauresequenzen (NSKs) Sequenzabschnitte einer 
Gesamtsequenz sind und die Primer sequenzspezif ische 
Primer sind, wobei man 

einzelstrangige NSKFs mit einer Lange von etwa 30 bis 1000 
Nukleotiden bereitstellt, die uberlappenden Teilsequenzen 
der Gesamtsequenz entsprechen, man 

die NSKF-Molekule direkt an einer planen Oberflache in 
einer zuf§lligen Anordnung bindet, man 

mit einer oder mehreren sequenzspezif ischen 
Primerpopulationen eine Hybridisierung (Annealing) an die 
immobilisierten NSKFs durchfuhrt, wobei die Dichte der 
einzelnen ext ens ions fahigen NSKF-Primer-Komplexe zwischen 
10 und 100 pro 100/xm 2 liegt, man 
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eine zyklische Aufbaureaktion der zu NSKFs komplementaren 
Strange durchfuhrt, indem man 

a) zu den gebundenen NSKF-Primer-Komplexen eine Losung 
zugibt, die eine oder mehrere Polytnerasen und ein bis 
vier modif izierte Nukleotide (NTs*) enthalt, die mit 
Fluoreszenzfarbstof fen markiert sind, wobei die bei 
gleichzeitiger Verwendung von mindestens zwei NTs* 
jeweils an den NTs* befindlichen Fluoreszenzfarbstof fe 
so gewahlt sind, daB sich die verwendeten NTs* durch 
Messung unterschiedlicher Fluoreszenzsignale 
voneinander unterscheiden lassen, und die NTs* 
strukturell so modifiziert sind, dass die Polymerase 
nach Einbau eines solchen NT* in einen wachsenden kom- 
plementaren Strang nicht in der Lage ist, ein weiteres 
NT* in denselben Strang einzubauen, wobei die zur 
Termination fuhrende Gruppe mit dem Fluoreszenzfarb- 
stoff abspaltbar ist f man 

b) die in Stufe a) erhaltene stationSre Phase unter 
Bedingungen inkubiert, die zur Verlangerung der kom- 
plementaren Strclnge geeignet sind, wobei die 
komplementaren Strange jeweils urn ein NT* verlangert 
werden, man 

c) die in Stufe b) erhaltenen stationaren Phase unter 
Bedingungen wascht, die zur Entfernung nicht in einen 
komplementaren Strang eingebauter NTs* geeignet sind, 
man 

d) die einzelnen, in komplementare Strange eingebauten 
NT*-Molekule durch Messen des fur den jeweiligen Fluo- 
reszenzfarbstof f charakteristischen Signals 
detektiert, wobei man gleichzeitig die relative Posi- 
tion der einzelnen Fluoreszenzsignale auf der 
Reaktionsoberf lache bestimmt, man 
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e) die zur Termination fuhrenden Gruppen mit den 
Fluoreszenzfarbstof fen von den am komplementaren 
Strang angefugten NTs* zur Erzeugung unmarkierter (NTs 
oder) NSKFs abspaltet, man 

f) die in Stufe e) erhaltene stationSre Phase unter 
Bedingungen w&scht, die zur Entfernung der zu 
Termination fuhrenden Gruppen mit den Fluoreszenz- 
farbstof fen geeignet sind, man 

die Stufen a) bis f) gegebenenfalls mehrfach wiederholt, 

wobei man die relative Position einzelner NSKF-Primer- 
Komplexe auf der Reaktionsoberf lStche und die Sequenz 
dieser NSKFs durch spezifische Zuordnung der in Stufe d) 
in aufeinanderfolgenden Zyklen an den jeweiligen 
Positionen detektierten Fluoreszenzsignale zu den NTs 
bestimmt . 

12. Verfahren nach Anspruch 11, dadurch gekennzeichnet , dass 
man im Detektionsschritt (d) folgende Detektionsarten 
einsetzt : Weitf eld-Epif luoreszenzmikroskopie, Laser- 
Scanning- F luoreszenzmikroskopie, TIRF-Mikroskopie . 

13. Verfahren nach Anspruch 11 oder 12, dadurch 
gekennzeichnet, dass die Konzentration einzelner 
sequenzspezif ischer Primer wahrend der Hybridisierung 
(Annealing) zwischen 10pmol/l und 1/xmol/l liegt. 

14. Verfahren nach Anspruch 11 oder 12, dadurch 
gekennzeichnet, dass die Konzentration einzelner 
sequenzspezifischer Primer wahrend der Hybridisierung 
(Annealing) zwischen ljxmol/1 und lmmol/1 liegt. 

15. Verfahren nach den Anspruchen 11 bis 14, dadurch 
gekennzeichnet, dass es ein Verfahren zur SNP- Analyse ist 
und man einen sequenzspezif ischen Primer zur 
Identifizierung jeder SNP-Stelle in der Gesamtsequenz 
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verwendet . 

16. Verfahren nach Anspruch 15, dadurch gekennzeichnet, dass 
die Zahl der parallel zu analysierenden SNP-Stellen grd&er 
als 2 ist und man fur jede SNP-Stelle einen 
sequenzspezif ischen Primer verwendet. 

17. Verfahren nach den Anspruchen 1 bis 16, dadurch gekenn- 
zeichnet, dass der zur strukturellen Modifikation 
verwendet e sterisch anspruchsvolle Ligand der zur Markie- 
rung verwendete Fluoreszenzfarbstof f ist. 

18. Verfahren nach den Ansprttchen 1 bis 17, dadurch gekenn- 
zeichnet, dass die Reaktionsoberf lache aus der Gruppe 
bestehend aus Silicon, Glas, Keramik, Kunststof fen, Gelen 
ausgewahlt ist. 

19. Verfahren nach Anspruch 18, dadurch gekennzeichnet, dass 
die Kunststoffe Polycarbonate oder Polystyrole oder 
Derivate derselben sind. 

20. Verfahren nach Anspruch 18, dadurch gekennzeichnet, dass 
die Gele Agarose- oder Polyacrylamidgele oder Derivate 
derselben sind. 

21. Verfahren nach Anspruch 20, dadurch gekennzeichnet, dass 
die Gele 1 bis 2 % Agarose-Gele oder 10 bis 15 % 
Polyacrylamid-Gele sind. 

22. Verfahren nach den Anspruchen 1 bis 21, dadurch 
gekennzeichnet, dass die Polymerase eine DNA- Polymerase 
ohne 3 ' - 5 1 -Endonukleaseaktivitat ist . 

23. Verfahren nach den Anspruchen 1 bis 21, dadurch 
gekennzeichnet, dass die Polymerase aus der Gruppe 
bestehend aus thermolabilen viralen, bakteriellen, 
eukaryontischen DNA-Polymerasen und thermos tabilen 
bakteriellen Polymerasen ausgewahlt ist. 
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24 . Verfahren nach Anspruch 23, dadurch gekennzeichnet, dass die 
DNA- Polymerase Sequenase Version 2, Kl enow- Fragment der DNA- 
Polymerase I aus E.coli ohne 3' -5* exonukleatische 
AktivitcLt, Polymerase Beta aus Saugetieren, Taq- Polymerase 
oder ProHA- DNA- Polymerase ist. 

25. Verfahren nach den Anspruchen 1 bis 24, dadurch 
gekennzeichnet, dass die NTs* alpha-Phosphorothioat-NTs* 
sind und die Polymersase das Kl enow- Fragment von E.coli- 
Polymerase I oder T4 -DNA- Polymerase ist. 

26. Verfahren nach den Anspruchen 1 bis 25, dadurch 
gekennzeichnet, dass die Fluoreszenzfarbstof fe aus der 
Gruppe bestehend aus Cyanin-Farbstof f en, Rhodamine, 
Xanthene und deren Derivaten ausgewahlt sind. 

27. Trager zur Durchftthrung des Verfahrens nach den Anspruchen 
11 bis 26, dadurch gekennzeichnet, dass auf seiner 
Oberflache die NSKFs in einer zufalligen Anordnung 
immobilisiert sind, wobei die Dichte der immobilisierten 
NSKF-Molekule zwischen 10 und 100 pro 100/xm 2 liegt. 

28. Trager zur Durchfuhrung des Verfahrens nach den Anspruchen 
11 bis 26, dadurch gekennzeichnet, dass auf seiner 
Oberflache die NSKFs in einer zufalligen Anordnung 
immobilisiert sind, wobei die Dichte der immobilisierten 
NSKF-Molekule zwischen 100 und 1.000.000 pro 100/xm 2 liegt. 

29. Kit zur Durchfuhrung des Verfahrens nach den Anspruchen 1 
bis 26, dadurch gekennzeichnet, dass es eine Reaktionsober- 
f lache (einen festen Trager) , zur Durchfuhrung des Verfah- 
rens erforderliche ReaktionslSsungen, ein oder mehrere 
Polymerasen, und Nukleotide (NTs) enthalt, von denen ein 
bis vier mit Fluoreszenzfarbstof fen markiert sind, wobei 
die markierten NTs ferner strukturell so modifiziert sind 
(NT* bzw. NTs*) , dass die Polymerase nach Einbau eines sol- 
chen NT* in einen wachsenden komplementaren Strang nicht in 
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der Lage ist, ein weiteres NT* in denselben Strang 
einzubauen, wobei der Fluoreszenzfarbstof f abspaltbar ist 
und die strukturelle Modifikation ein abspaltbarer sterisch 
anspruchsvoller Ligand ist. 

30. Kit nach Anspruch 29, dadurch gekennzeichnet, dass der zur 
strukturellen Modifikation verwendete sterisch anspruchs- 
volle Ligand der zur Markierung verwendete Fluoreszenzfarb- 
stof f ist. 

31. Kit nach Anspruch 29 Oder 30, dadurch gekennzeichnet, dass 
es ferner Bestandteile enthalt: 

a) zur Erzeugung von Einzelstr&ngen aus Doppelstrangen 
erforderliche Reagenzien, 

b) Nukleinsauremolekule, die als PBS in die NSKFs einge- 
fuhrt werden, 

c ) Oligonukleo t id- Primer , 

d) zur Abspaltung der Fluoreszenzfarbstof fe und sterisch 
anspruchsvollen Liganden erforderliche Reagenzien, 

und/oder 

e ) Waschlosungen . 

32. Kit nach den Anspruchen 29 bis 31, dadurch gekennzeichnet, 
dass die Reaktionsoberf l&che aus der Gruppe bestehend aus 
Silicon, Glas, Keramik, Kunststof fen, Gelen ausgewahlt ist. 

33. Kit nach Anspruch 32, dadurch gekennzeichnet, dass die 
Kunststoffe Polycarbonate Oder Polystyrole Oder Derivate 
derselben sind. 

34. Kit nach Anspruch 32, dadurch gekennzeichnet, dass die Gele 
Agarose- oder Polyacrylamidgele oder Derivate derselben 
sind. 

35. Kit nach Anspruch 34, dadurch gekennzeichnet, dass die Gele 
1 bis 2% Agarose-Gele oder 10 bis 15% Polyacrylamid-Gele 
sind. 
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36. Kit nach den Anspriichen 29 bis 35, dadurch gekennzeichnet, 
dalS die Reaktionsoberf lache ein Trager nach den Anspriichen 
27 und 28 ist. 

37. Kit nach den Anspriichen 29 bis 36, dadurch gekennzeichnet/ 
dass die DNA- Polymerase eine DNA- Polymerase ohne 3 1 -5 * - 
Endonukleaseaktivitat ist. 

38. Kit nach Anspruch 37, dadurch gekennzeichnet, dass die 
Polymerase aus der Gruppe bestehend aus thermolabilen 
viralen, bakteriellen, eukaryontischen DNA-Polymerasen und 
thermostabilen bakteriellen Polymerasen ausgewahlt ist. 

39. Kit nach Anspruch 38, dadurch gekennzeichnet, dass die DNA- 
Polymerase Sequenase Version 2, Klenow- Fragment der DNA- 
Polymerase I aus E.coli ohne 3 '-5* exonukleatische 
Aktivitat, Polymerase Beta aus Saugetieren, Taq- Polymerase 
Oder ProHa -DNA- Polymerase ist. 

40. Kit nach den Anspruchen 29 bis 39, dadurch gekennzeichnet, 
dass die NTs* alpha- Phosphorothioat -NTs* sind und die 
Polymersase das Klenow- Fragment von E.coli -Polymerase I 
oder T4 -DNA- Polymerase ist. 

41. Kit nach den Anspruchen 29 bis 40, dadurch gekennzeichnet, 
dass die Fluoreszenzfarbstof fe aus der Gruppe bestehend aus 
Cyanin-Farbstof fen, Rhodamine, Xanthene und deren Derivaten 
ausgewahlt sind. 

42. Nukleotid der Formel 



0 
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NH 2 
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43. Nukleotid der Formel 
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45. Nukleotid nach Anspruch 42 bis 44, dadurch gekennzeichnet, 
dass an die terminale Aminogruppe ein Fluoreszerxzf arbstof f 
angeheftet ist. 



46. Nukleotid der Formel 




Linker 



* 
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47. Nukleotid der Formel 



71) 




R= dCTP 
dUTP 



Linker 



48. Nukleotid der Formel 
7j) dNTP-SS-TRTTC (L 14) 




Linker 



49. Verwendung eines Nukleotids nach den AnsprQchen 42 bis 48 
als NT* in einem Verfahren nach den Anspruchen 1 bis 26. 

50. Verwendung eines Nukleotids entsprechend Fig. 7k, 7L, 7m, 
als NT* in einem Verfahren nach den Anspruchen 1 bis 26. 
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Fig. 1 



Ausgangsmaterial 



2) 



Fragmente 50-1000 bp 



Fragmente mit jeweils 
einem Primer 



4) 




Immobilisierte Fragmente 



5) 



Zugabe einer L6sung mit 
Polymerasen und NTs* 



6) 




Waschschritt 



7) 



8) 




Detektion 



Entfernung der Markierung und 
der zur Termination fuhrenden 
Gruppe 



Legende: 

feste Oberflache 



Polymerase NT* Signal von NT* 



o 



Mikroskop und 
Beleuchtung 



• ■ • 
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2/1, Fi8 " 2 



Beispie! fur allgemeioe Struktur von NSKF-Primer-Komplexen 



2a) 




Legende: 

1) Primer 

2) Primerbindungsstelle 

3) NSKF 
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OligonuWeotid-Konstruktion mit einer Primerbindungsstelle und blockierten 
Enden. 

3a) 

0 ligonukleo tidkomplex 5 X 3 s 

37/ 

Primerbindungsstelle //- // 

3b) 

Modifikation einer Seite des Oligonukleotides an beiden Strangen. Nur ein Ende steht 
fiir die Ligation zur Verfugung. 

xxxxx-5 s 3" 

kkk-37/ 115* 

Die modifizierenden Gruppen "xxxxx-" und "kick-" konnen z.B. zur Immobilisation 
Oder Markierung dienen. 



3c) 

Resultat der Ligation des Oligonukleotides mit den DNA-Fragmenten 

xxxxx-5 x -/ // //3 N -kkk 

kkk-3// // /- 5^-xxxxx 



3d) 

Konstruktion der DNA-Fragmente nach der Denaturiening 

xxxxx-5 s -/ .//- //3 N -kkk 
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Fig. 4 



Nukleotid-Tailing 



5- 3' einzelstrangiges DNA-Fragment 

+ Deoxynucleotidyltransferase 
+ dGTP 

J 



(G) n 3^ 
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WO 02/088382 PCT/EP02/04659 

r, 

5/19 Fig. 5 



5a) 



■//////////////////// 




Legende: 

1) feste OberflSche 

2) Gel 

3) zur Immobilisation geeignete Gruppen, z.B. Avidin oder Streptavidin, oder 
Oligonukleotide 

4) NSKFs 

5) AgarosekUgelchen 
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YZmZMZZZZZZZZZZZ&L 




Flussrichtung 



Legende: 

1) Reaktionsoberflache 

2) feste Unterlage 

3) Vorratsbehalter 

4) Pumpe 

5) Ventil 

6) Objektiv des Mikroskops 
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7a) 



7b) 




Legende: 

A, C, E - Verbindungselemente im Linker 
A - Linkerrest nach der Spaltung 
B - spaltbare Verbindung / Gruppe 
D - zur Termination fiihrende Gruppe 
F - Fluoreszenzfarbstoff (Marker) 



WO 02/088382 



PCT/EP02/04659 



8/19 Fig. 7 

7c) eingebaute modifizierte NTs* nach der Spaltung 




Legende: 

A, C, E - Verbindungselemente im Linker 
A - Linkerrest nach der Spaltung 
B - spaltbare Verbindung / Gruppe 
D - zur Termination fiihrende Gruppe 
F - Fluoreszenzfarbstoff (Marker) 
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Fig. 7 
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R= dCTP 
dUTP 
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Linker 



7j) dNTP-SS-TRTTC (L 14) 
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Linker 
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Fig. 7 



7k-2) 



PPP— 0 





7k-3) 



PPP— i 





Base = U; C 



R,; R 2 ; R 3 ; R 4 = -OCH 3 ; -CH 3 ; -OH ; -H ; -NH 2 ; -N0 2 ; -O-COAIkyl ; -Halogen 



Z; X = -NH- ; -S- ; -O- ; -CO-NH- ; -CO-O- ; -NH-CO- ; -O-CO- 



C = -CO-S- ; -CO-O- ; -S-S- ; -S-CO- ; -O-CO- 



E = "(CH 2 ) n1 - ; -(CH=CH-CH 2 ) n2 - ; -(CH^-NH-CO-fCH,),, 



^2 



V - -(OH,),,,- ; -(OfcOt-CH,),,- ; .(OH,)„-NH^O-(CH,) M - ; — 
n, ; n 2 ; n 3 ; n 4 = 1 - 5 



F = Fluoreszenzfarbstoff 
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R,; R 2 ; R 3 ; R 4 = -OCH3 ; -CH 3 ; -OH ; -H ; -NH 2 ; -N0 2 ; -O-COAIkyl ; -Halogen 



Z; X = -NH- ; -S- ; -O- ; -CO-NH- ; -CO-O- ; -NH-CO- ; -O-CO- 



C = -CO-S- ; -CO-O- ; -S-S- ; -S-CO- ; -O-CO- 



E = -(CH 2 ) nl - ; -(CH^CH-CH^- ; -(CH^-NH-CCHCHjU- 



Y = -(CH 2 ) nl - ; -(CH^H-CH^- ; -(CH^-NH-CO-tCH,),*- ; -f>- 
n 1 ; n 2 ; n 3 ; n 4 = 1 - 5 



F = Fluoreszenzfarbstoff 
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^ H Base = U; C 



Fig. 7 



R,; Rj; R3; R 4 = -OCH 3 ; -CH 3 ; -OH ; -H ; -NH 2 ; -NO., ; -O-COAIkyl ; -Halogen 

Z; X = -NH- ; -S- ; -O- ; -CO-NH- ; -CO-O- ; -NH-CO- ; -O-CO- 

C = -CO-S- ; -CO-O- ; -S-S- ; -S-CO- ; -O-CO- 

E ; Y = -(CH 2 ) n1 - ; -(C^CH-CH^- ; -(CH^-NH-CO-fCH^. 
n, ; ; n 3 ; n 4 = 1 - 5 



F = Fluoreszenzfarbstoff 
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17/19 Fig- 8 



Rechner 




Legende: 

1) Lichtquelle zur Anregung der Fluoreszenz 

2) Lichtleitender Teil 

3) Scanntisch 

4) Vorrichtung zur Selektion von Spektren 

5) Detektionsvorrichtung 

6) Computer mit Steuerungs- und Analysefiinktionen 

7) Oberflache mit immobilisierten NSKFs 



i 
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19/19 Fig. 9 

Sequenzierungsreaktion auf 2 getrennten Oberflachen. 

Wahrend eine Oberflache gescannt wird, werden auf der andern Oberflache alle anderen 
Zyklusschritte durchgefuhrt. 
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SEQUENZ PROTOKOLL 



<110> Dmitri Tcherkassov 

<110> Prof .Dr. Walther Traut 

<110> Dr. Englbert Bauml 

<110> Christian Hennig 

<110> Norman Kock 

<120> Verfahren zur Analyse von Nukleinsaureketten 

<130> P060086 

<140> 
<141> 

<160> 9 

<170> Patentln Ver. 2.1 

<210> 1 

<211> 19 

<212> DNA 

<213> Kuns tliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer (T 7 - 19 -Primer) 



<210> 2 

<211> 19 

<212> DNA 

<213> Runs tliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primerbindungsstelle 



<210> 3 

<211> 12 

<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Sequenz aus Beispiel 4 



<400> 1 

taatacgact cactatagg 



19 



<400> 2 

attatgctga gtgatatcc 



19 



<400> 3 
accaaaacac cc 



12 



<210> 4 

<211> 32 

<212> DNA 

<213> Kunstliche Sequenz 



<220> 

<223> Beschreibung der kunstlichen Sequenz: Sequenz aus Beispiel 4 



' 4 I 
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<400> 4 

atcatcgttc gaaatatcga tcgcctgatg cc 32 

<210> 5 
<211> 24 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Sequenz aus Beispiel 4 
<400> 5 

atcgttcgaa atatcgatcg cctg 24 

<210> 6 
<211> 24 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Sequenz aus Beispiel 4 
<400> 6 

attgttcgaa atatcgatcg cctg 24 



<210> 7 
<211> 24 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Sequenz aus Beispiel 4 
<400> 7 

tagcaagctt tatagctagc ggac 24 



<210> 8 
<211> 24 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Sequenz aus Beispiel 4 
<400> 8 

taacaagctt tatagctagc ggac 24 



<210> 9 
<2ll> 11 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Sequenz aus Beispiel 4 



<400> 9 
acaacaacac c 



11 



